Forwarded from Техно Фил
This media is not supported in your browser
VIEW IN TELEGRAM
Это Фредди Меркьюри поёт песню Imagine Dragons.
Вот нейронка. А вот подробная инструкция на YouTube, как сделать так же.
Вот нейронка. А вот подробная инструкция на YouTube, как сделать так же.
👍22🔥5
Forwarded from эйай ньюз
🔥DeepFloyd IF: новая text-2-image модель
StablityAI выпустили новую модель, которая очень похожа на Imagen от Google, но работает лучше и в open-source.
Архитектура IF, как и у Imagen состоит из трех диффузионных моделей, каждая из которых работает в пространстве RGB и прогрессивно увеличивают картинку. Сначала Text→64×64, затем (Text+64×64)→256×256, и наконец (Text+256×256)→1024×1024. А текст кодируется с помощью текстового энкодера T5.
Почему это круто?
— IF неплохо умеет генерировать текст (я даже генерил в канале ранее), явно лучше чем StableDiffusion XL
— Нормальная открытая имплементация по типу Imagen, которой до сих пор не было. Возможно с какими-то трюками, о которых мы узнаем, когда авторы выпустят блогпост
— FID скор измеряет похожесть снеренированных картинок на реальные. Это чуть ли не основная метрика для качества генерации. У IF FID=6.7, тогда как у Imagen 7.3. Меньше — лучше. Разрыв не космический, но приличный.
Код выложили, веса ждем тут. И ждем подробной статьи от авторов.
@ai_newz
StablityAI выпустили новую модель, которая очень похожа на Imagen от Google, но работает лучше и в open-source.
Архитектура IF, как и у Imagen состоит из трех диффузионных моделей, каждая из которых работает в пространстве RGB и прогрессивно увеличивают картинку. Сначала Text→64×64, затем (Text+64×64)→256×256, и наконец (Text+256×256)→1024×1024. А текст кодируется с помощью текстового энкодера T5.
Почему это круто?
— IF неплохо умеет генерировать текст (я даже генерил в канале ранее), явно лучше чем StableDiffusion XL
— Нормальная открытая имплементация по типу Imagen, которой до сих пор не было. Возможно с какими-то трюками, о которых мы узнаем, когда авторы выпустят блогпост
— FID скор измеряет похожесть снеренированных картинок на реальные. Это чуть ли не основная метрика для качества генерации. У IF FID=6.7, тогда как у Imagen 7.3. Меньше — лучше. Разрыв не космический, но приличный.
Код выложили, веса ждем тут. И ждем подробной статьи от авторов.
@ai_newz
🔥10
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Пока вы тут ржали над папой римским и сгенерированным арестом Трампа, взрослые мальчики из политики расчехлили Generative AI и долбанули вот таким роликом по мозгам американских избирателей.
Джо Байден объявил о своей кампании по переизбранию, и Республиканский национальный комитет (RNC) ответил вот таким вот ИИ-фейком.
Видео (как вы уже убедились) содержит серию очень хорошо сделанных изображений, показывающих переизбрание Байдена в 2024 году. Оно демонстрирует, что это приведет к серии кризисов, среди которых, взрывы на Тайване после китайского вторжения и развертывание военных на улицах, предположительно, американских.
Небольшой отказ от ответственности в верхнем левом углу кадра гласит: «Построен полностью с использованием изображений ИИ», а подпись под видео на YouTube гласит: «Созданный ИИ взгляд на возможное будущее страны, если Джо Байден будет переизбран в 2024 году».
Вот это вот "Созданный ИИ взгляд на" - это прям виртуозный уход от ответственности.
Я пока не нашел making of или детали, как это делали. Но думаю, что следующие выборы в штатах будут очень развеселые с точки зрения фейков, дипфейков и прочих созданных ИИ взглядов на происходящее.
https://www.forbes.com/sites/ariannajohnson/2023/04/25/republicans-share-an-apocalyptic-ai-powered-attack-ad-against-biden-heres-how-to-spot-a-deepfake/
Джо Байден объявил о своей кампании по переизбранию, и Республиканский национальный комитет (RNC) ответил вот таким вот ИИ-фейком.
Видео (как вы уже убедились) содержит серию очень хорошо сделанных изображений, показывающих переизбрание Байдена в 2024 году. Оно демонстрирует, что это приведет к серии кризисов, среди которых, взрывы на Тайване после китайского вторжения и развертывание военных на улицах, предположительно, американских.
Небольшой отказ от ответственности в верхнем левом углу кадра гласит: «Построен полностью с использованием изображений ИИ», а подпись под видео на YouTube гласит: «Созданный ИИ взгляд на возможное будущее страны, если Джо Байден будет переизбран в 2024 году».
Вот это вот "Созданный ИИ взгляд на" - это прям виртуозный уход от ответственности.
Я пока не нашел making of или детали, как это делали. Но думаю, что следующие выборы в штатах будут очень развеселые с точки зрения фейков, дипфейков и прочих созданных ИИ взглядов на происходящее.
https://www.forbes.com/sites/ariannajohnson/2023/04/25/republicans-share-an-apocalyptic-ai-powered-attack-ad-against-biden-heres-how-to-spot-a-deepfake/
❤19😱6🤩1
Forwarded from Мишин Лернинг
👾 Мы DeepFloyd (Research AI Lab at StabilityAI) зарелизили лучшую Text-to-Image модель DeepFloyd IF
DeepFloyd IF это новая каскадная диффузионная модель основанная на идеи Imagen от Google:
— Текст кодируется T5 XXL v1.1
— Далее интерпретируется в пиксели через IF-I-XL (4.3B UNet), генерирующий изображения в 64х64
— IF-II-L (1.2B кастомный Optimal UNet) апскелит изображения 64х64 в 256х256, используя T5
— Для финальной картинки в 1024х1024, благодаря модульному подходу, можно использовать IF-III-L (пока не опенсорснут) или Stable x4
Благодаря тому, что:
— Модель параметризирована сильнее чем GLIDE, DALL-E 2, Imagen, eDiff-I: 2B против 4.3B у DeepFloyd IF
— Апскейлеры больше и имеют более оптимальную архитектуру в сравнение с Image и DALL-E 2
🏆 DeepFloyd IF выбивает Zero-Shot COCO@30K SOTA, тем самым являсь лучшей Text-to-Image моделью не только в опен-сорсе, но и вообще!
💻 Сайт лабы DeepFloyd
🤖 Страница нейроки DeepFloyd IF
👽 DeepFloyd Дискорд
🖥 GitHub
🤗 HuggingFace
👾 Генерить тут: Demo 👈
DeepFloyd IF это новая каскадная диффузионная модель основанная на идеи Imagen от Google:
— Текст кодируется T5 XXL v1.1
— Далее интерпретируется в пиксели через IF-I-XL (4.3B UNet), генерирующий изображения в 64х64
— IF-II-L (1.2B кастомный Optimal UNet) апскелит изображения 64х64 в 256х256, используя T5
— Для финальной картинки в 1024х1024, благодаря модульному подходу, можно использовать IF-III-L (пока не опенсорснут) или Stable x4
Благодаря тому, что:
— Модель параметризирована сильнее чем GLIDE, DALL-E 2, Imagen, eDiff-I: 2B против 4.3B у DeepFloyd IF
— Апскейлеры больше и имеют более оптимальную архитектуру в сравнение с Image и DALL-E 2
🏆 DeepFloyd IF выбивает Zero-Shot COCO@30K SOTA, тем самым являсь лучшей Text-to-Image моделью не только в опен-сорсе, но и вообще!
💻 Сайт лабы DeepFloyd
🤖 Страница нейроки DeepFloyd IF
👽 DeepFloyd Дискорд
🖥 GitHub
🤗 HuggingFace
👾 Генерить тут: Demo 👈
❤17
This media is not supported in your browser
VIEW IN TELEGRAM
Версия поменбше.
Более спокойная в плане цветов и cfg scale.
Более спокойная в плане цветов и cfg scale.
🔥36❤2👍2
Forwarded from ForkLog AI
💵 Немецкий стоковый фотограф Роберт Кнешке получил штраф за просьбу удалить свои работы из открытого обучающего датасета LAION-5B.
В феврале 2023 года он узнал, что сделанные им снимки использовались для тренировки генеративных моделей. Также Кнешке обнаружил «кучу изображений» из своего портфолио в LAION-5B.
🙅♂️ Фотограф попросил владельца датасета удалить работы и получил ответ от юридической фирмы Heidrich Rechtsanwälte. В компании заявили, что ее клиент поддерживает базу данных только со ссылками на изображения из интернета и не хранит картинки. Значит нарушения нет и удалять нечего, ответили юристы.
В конце марта Кнешке отправил команде LAION запрос о прекращении противоправных действий. Он снова попросил удалить фото и предоставить информацию о степени и времени их использования.
Юристы Heidrich Rechtsanwälte ответили об отсутствии нарушений клиентом. Также они потребовали в течение 14 дней выплатить ущерб в размере $979 за необоснованную жалобу.
⚖️ В конце апреля фотограф подал иск против LAION в окружной суд Гамбурга в Германии.
#суд
В феврале 2023 года он узнал, что сделанные им снимки использовались для тренировки генеративных моделей. Также Кнешке обнаружил «кучу изображений» из своего портфолио в LAION-5B.
🙅♂️ Фотограф попросил владельца датасета удалить работы и получил ответ от юридической фирмы Heidrich Rechtsanwälte. В компании заявили, что ее клиент поддерживает базу данных только со ссылками на изображения из интернета и не хранит картинки. Значит нарушения нет и удалять нечего, ответили юристы.
В конце марта Кнешке отправил команде LAION запрос о прекращении противоправных действий. Он снова попросил удалить фото и предоставить информацию о степени и времени их использования.
Юристы Heidrich Rechtsanwälte ответили об отсутствии нарушений клиентом. Также они потребовали в течение 14 дней выплатить ущерб в размере $979 за необоснованную жалобу.
⚖️ В конце апреля фотограф подал иск против LAION в окружной суд Гамбурга в Германии.
#суд
😁33😢13🔥3👍2❤1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🦮 Вербальное управление робопёсиком Spot с помощью Whisper
В предыдущем посте я допустил неточность. ChatGPT к робопёсику Spot прикрутили не Boston Dynamics, а их партнёры – фирма Levatas, которая программирует Спотов выполнять различные миссии в индустрии. Например, побегать по фабрике и проверить, что все в порядке, снять показания с датчиков температуры, давление и т.д., сделать теплоснимки оборудования, и прочие рутинные задачи, которые нужно регулярно производить в индустрии.
"There is nothing better than looking at the effect of you code in real-time". Как же я согласен с этим!
На видео пример того, как парни используют модель Whisper (я про нее писал в этом посте) для передачи базовых команд робопсу.
@ai_newz
В предыдущем посте я допустил неточность. ChatGPT к робопёсику Spot прикрутили не Boston Dynamics, а их партнёры – фирма Levatas, которая программирует Спотов выполнять различные миссии в индустрии. Например, побегать по фабрике и проверить, что все в порядке, снять показания с датчиков температуры, давление и т.д., сделать теплоснимки оборудования, и прочие рутинные задачи, которые нужно регулярно производить в индустрии.
"There is nothing better than looking at the effect of you code in real-time". Как же я согласен с этим!
На видео пример того, как парни используют модель Whisper (я про нее писал в этом посте) для передачи базовых команд робопсу.
@ai_newz
❤1
Forwarded from эйай ньюз
💻StarCode — самая мощная открытая модель для генерации кода
Ура, мы дождались открытых моделей для генерации кода (привет Copilot)! Компания BigCode выпустила сразу две модели.
StarCoder - это 15B LLM для генерации кода с 8k токенов контекста, училась на открытом коде с 80+ языками программирования и зафайнтюнена на 35B Python токенах. Выдает наилучшие результаты для генерации питоновского кода.
А базовая модель
StarCoderBase более универсальная и тренировалась на 1T токенов на 80+ языках программирования.
Есть также плагин для VSCode (см. видео).
@ai_newz
Ура, мы дождались открытых моделей для генерации кода (привет Copilot)! Компания BigCode выпустила сразу две модели.
StarCoder - это 15B LLM для генерации кода с 8k токенов контекста, училась на открытом коде с 80+ языками программирования и зафайнтюнена на 35B Python токенах. Выдает наилучшие результаты для генерации питоновского кода.
А базовая модель
StarCoderBase более универсальная и тренировалась на 1T токенов на 80+ языках программирования.
Есть также плагин для VSCode (см. видео).
@ai_newz
👍27
Как подключить Colab к удаленной машине\хостингу\vast.ai\runprod и иже с ними.
(ну или пробросить любой порт с удаленной машины на localhost локальной)
1. Заходим на https://ngrok.com/ и регистрируем аккаунт. Копируем токен авторизации (или всю команду авторизации целиком)
2. Качаем и распаковываем ngrok куда-нибудь.
3. Открываем терминал в папке с ngrok.
4. Выполняем команду авторизации, которую получили после регистрации в пункте №1 -
Linux:
пуск - настройки - приложения - дополнительные функции -
(run - settings - apps - optional features)
Ищем там OpenSSH. Если у вас есть OpenSSH Server - все ок. Если нет, идем в
пуск - настройки - приложения - приложения и функции -
(run - settings - apps - apps&features)
ищем OpenSSH и ставим OpenSSH Server.
После установки:
пуск - службы - OpenSSH Server - запустить
(run - services - openssh server - start)
7. На локальной машине: ставим клиент OpenSSH. (через пуск - настройки - приложения - приложения и функции или run - settings - apps - apps&features)
8. В консоли пишем:
9. Введите пароль вашего удаленного пользователя.
10. Подключаем колаб через connect -> connect to local runtime
@derplearning
(ну или пробросить любой порт с удаленной машины на localhost локальной)
1. Заходим на https://ngrok.com/ и регистрируем аккаунт. Копируем токен авторизации (или всю команду авторизации целиком)
2. Качаем и распаковываем ngrok куда-нибудь.
3. Открываем терминал в папке с ngrok.
4. Выполняем команду авторизации, которую получили после регистрации в пункте №1 -
ngrok config add-authtoken <your token>5. Открываем туннель для ssh -
ngrok tcp 226. Поднимаем ssh-сервер.
Linux:
sudo apt install openssh-serverWin10/11:
sudo service ssh start
пуск - настройки - приложения - дополнительные функции -
(run - settings - apps - optional features)
Ищем там OpenSSH. Если у вас есть OpenSSH Server - все ок. Если нет, идем в
пуск - настройки - приложения - приложения и функции -
(run - settings - apps - apps&features)
ищем OpenSSH и ставим OpenSSH Server.
После установки:
пуск - службы - OpenSSH Server - запустить
(run - services - openssh server - start)
7. На локальной машине: ставим клиент OpenSSH. (через пуск - настройки - приложения - приложения и функции или run - settings - apps - apps&features)
8. В консоли пишем:
ssh <username>@<ngrok external address> -p <ngrok port> -L 8888:localhost:8888Где <username> - это имя пользователя удаленной машины, <ngrok external address> и <port> - те, которые вы получаете при запуске ngrok сервера в пункте №5.
9. Введите пароль вашего удаленного пользователя.
10. Подключаем колаб через connect -> connect to local runtime
@derplearning
Ngrok
ngrok | API Gateway, Kubernetes Ingress, Webhook Gateway
ngrok simplifies app delivery by unifying API gateway, Kubernetes ingress, multi-cluster load balancing and more with ngrok's Universal Gateway.
🔥20❤7😱3🤩1
Похоже варп перестает быть ламповым инди.
https://youtu.be/HkM-7wxtkGA
https://youtu.be/HkM-7wxtkGA
YouTube
Video to AI Animation Tutorial For Beginners: Stable WarpFusion + Controlnet | MDMZ
Transform your videos into visually stunning animations using AI with Stable Warpfusion and ControlNet
Wirestock: https://bit.ly/44ua9KN
Get 20% Discount with code: MDMZ
📁Project Files:
https://bit.ly/3VyyXNE
Stable WarpFusion v0.10 Nightly: https://bit.ly/3LK0wPM…
Wirestock: https://bit.ly/44ua9KN
Get 20% Discount with code: MDMZ
📁Project Files:
https://bit.ly/3VyyXNE
Stable WarpFusion v0.10 Nightly: https://bit.ly/3LK0wPM…
🔥12😁3❤2