Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.17K photos
913 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Сегодня целый день тестировал свою новую лору-модель. Она натренирована на создание иконок в минималистическом стиле. Идеально подходит для приложений и вебсайтов. Вместе с расширением Vector Studio вы сразу получаете генерации в noscript варианте и можете убрать лишние элементы. К сожалению не всё идеально, в одних случаях идеально слушается подсказки, в других наоборот. Сделаны выводы для создания второй версии, где эта проблема возможно уйдёт. Натренирована на Deliberate, поэтому лучше генерировать на ней. На других вообще не работает (я проверял). Генерации совсем не похожи на оригинал, поэтому можете спокойно их использовать не опасаясь проблем с авторскими.

Модель Deliberate
Lora Minimalist icons
Активируется по триггеру icon of. Негативный промпт не требуется. Более подробный промпты смотрите по ссылке
🔥28👍95😱1🎉1
Forwarded from Техно Фил
This media is not supported in your browser
VIEW IN TELEGRAM
Это Фредди Меркьюри поёт песню Imagine Dragons.

Вот нейронка. А вот подробная инструкция на YouTube, как сделать так же.
👍22🔥5
shtosh
😁29🤩6
Forwarded from Axis of Ordinary
😁84
Forwarded from эйай ньюз
🔥DeepFloyd IF: новая text-2-image модель

StablityAI выпустили новую модель, которая очень похожа на Imagen от Google, но работает лучше и в open-source.

Архитектура IF, как и у Imagen состоит из трех диффузионных моделей, каждая из которых работает в пространстве RGB и прогрессивно увеличивают картинку. Сначала Text→64×64, затем (Text+64×64)→256×256, и наконец (Text+256×256)→1024×1024. А текст кодируется с помощью текстового энкодера T5.

Почему это круто?
— IF неплохо умеет генерировать текст (я даже генерил в канале ранее), явно лучше чем StableDiffusion XL

— Нормальная открытая имплементация по типу Imagen, которой до сих пор не было. Возможно с какими-то трюками, о которых мы узнаем, когда авторы выпустят блогпост

— FID скор измеряет похожесть снеренированных картинок на реальные. Это чуть ли не основная метрика для качества генерации. У IF FID=6.7, тогда как у Imagen 7.3. Меньше — лучше. Разрыв не космический, но приличный.

Код выложили, веса ждем тут. И ждем подробной статьи от авторов.

@ai_newz
🔥10
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Пока вы тут ржали над папой римским и сгенерированным арестом Трампа, взрослые мальчики из политики расчехлили Generative AI и долбанули вот таким роликом по мозгам американских избирателей.
Джо Байден объявил о своей кампании по переизбранию, и Республиканский национальный комитет (RNC) ответил вот таким вот ИИ-фейком.

Видео (как вы уже убедились) содержит серию очень хорошо сделанных изображений, показывающих переизбрание Байдена в 2024 году. Оно демонстрирует, что это приведет к серии кризисов, среди которых, взрывы на Тайване после китайского вторжения и развертывание военных на улицах, предположительно, американских.

Небольшой отказ от ответственности в верхнем левом углу кадра гласит: «Построен полностью с использованием изображений ИИ», а подпись под видео на YouTube гласит: «Созданный ИИ взгляд на возможное будущее страны, если Джо Байден будет переизбран в 2024 году».

Вот это вот "Созданный ИИ взгляд на" - это прям виртуозный уход от ответственности.

Я пока не нашел making of или детали, как это делали. Но думаю, что следующие выборы в штатах будут очень развеселые с точки зрения фейков, дипфейков и прочих созданных ИИ взглядов на происходящее.
https://www.forbes.com/sites/ariannajohnson/2023/04/25/republicans-share-an-apocalyptic-ai-powered-attack-ad-against-biden-heres-how-to-spot-a-deepfake/
19😱6🤩1
Media is too big
VIEW IN TELEGRAM
Шакирующее видео (простити)
сорс в комментах
🔥21
👾 Мы DeepFloyd (Research AI Lab at StabilityAI) зарелизили лучшую Text-to-Image модель DeepFloyd IF

DeepFloyd IF это новая каскадная диффузионная модель основанная на идеи Imagen от Google:
— Текст кодируется T5 XXL v1.1
— Далее интерпретируется в пиксели через IF-I-XL (4.3B UNet), генерирующий изображения в 64х64
— IF-II-L (1.2B кастомный Optimal UNet) апскелит изображения 64х64 в 256х256, используя T5
— Для финальной картинки в 1024х1024, благодаря модульному подходу, можно использовать IF-III-L (пока не опенсорснут) или Stable x4

Благодаря тому, что:
— Модель параметризирована сильнее чем GLIDE, DALL-E 2, Imagen, eDiff-I: 2B против 4.3B у DeepFloyd IF
— Апскейлеры больше и имеют более оптимальную архитектуру в сравнение с Image и DALL-E 2

🏆 DeepFloyd IF выбивает Zero-Shot COCO@30K SOTA, тем самым являсь лучшей Text-to-Image моделью не только в опен-сорсе, но и вообще!

💻 Сайт лабы DeepFloyd
🤖 Страница нейроки DeepFloyd IF
👽 DeepFloyd Дискорд

🖥 GitHub
🤗 HuggingFace

👾 Генерить тут: Demo 👈
17
This media is not supported in your browser
VIEW IN TELEGRAM
StableWarp 0.12 CN 1.1 1080x1920

Settings: YT
🔥51
This media is not supported in your browser
VIEW IN TELEGRAM
Версия поменбше.
Более спокойная в плане цветов и cfg scale.
🔥362👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Онеме, кудаж без него
🔥33👍43😢1
Forwarded from ForkLog AI
💵 Немецкий стоковый фотограф Роберт Кнешке получил штраф за просьбу удалить свои работы из открытого обучающего датасета LAION-5B.

В феврале 2023 года он узнал, что сделанные им снимки использовались для тренировки генеративных моделей. Также Кнешке обнаружил «кучу изображений» из своего портфолио в LAION-5B.

🙅‍♂️ Фотограф попросил владельца датасета удалить работы и получил ответ от юридической фирмы Heidrich Rechtsanwälte. В компании заявили, что ее клиент поддерживает базу данных только со ссылками на изображения из интернета и не хранит картинки. Значит нарушения нет и удалять нечего, ответили юристы.

В конце марта Кнешке отправил команде LAION запрос о прекращении противоправных действий. Он снова попросил удалить фото и предоставить информацию о степени и времени их использования.

Юристы Heidrich Rechtsanwälte ответили об отсутствии нарушений клиентом. Также они потребовали в течение 14 дней выплатить ущерб в размере $979 за необоснованную жалобу.

⚖️ В конце апреля фотограф подал иск против LAION в окружной суд Гамбурга в Германии.

#суд
😁33😢13🔥3👍21
Штош, пора паковать чемоданы :D

тест - https://culturacompass.com/ru
🤩7🔥1😁1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🦮 Вербальное управление робопёсиком Spot с помощью Whisper

В предыдущем посте я допустил неточность. ChatGPT к робопёсику Spot прикрутили не Boston Dynamics, а их партнёры – фирма Levatas, которая программирует Спотов выполнять различные миссии в индустрии. Например, побегать по фабрике и проверить, что все в порядке, снять показания с датчиков температуры, давление и т.д., сделать теплоснимки оборудования, и прочие рутинные задачи, которые нужно регулярно производить в индустрии.

"There is nothing better than looking at the effect of you code in real-time". Как же я согласен с этим!

На видео пример того, как парни используют модель Whisper (я про нее писал в этом посте) для передачи базовых команд робопсу.

@ai_newz
1
😁72🔥7🤩5
Когда ютуб хорни
😁18🤩4
Forwarded from Barmagloth
😢18😁14🔥2
Forwarded from эйай ньюз
💻StarCode — самая мощная открытая модель для генерации кода

Ура, мы дождались открытых моделей для генерации кода (привет Copilot)! Компания BigCode выпустила сразу две модели.

StarCoder - это 15B LLM для генерации кода с 8k токенов контекста, училась на открытом коде с 80+ языками программирования и зафайнтюнена на 35B Python токенах. Выдает наилучшие результаты для генерации питоновского кода.

А базовая модель
StarCoderBase более универсальная и тренировалась на 1T токенов на 80+ языках программирования.

Есть также плагин для VSCode (см. видео).

@ai_newz
👍27
Как подключить Colab к удаленной машине\хостингу\vast.ai\runprod и иже с ними.
(ну или пробросить любой порт с удаленной машины на localhost локальной)

1. Заходим на https://ngrok.com/ и регистрируем аккаунт. Копируем токен авторизации (или всю команду авторизации целиком)
2. Качаем и распаковываем ngrok куда-нибудь.
3. Открываем терминал в папке с ngrok.
4. Выполняем команду авторизации, которую получили после регистрации в пункте №1 -
ngrok config add-authtoken <your token>
5. Открываем туннель для ssh -
ngrok tcp 22

6. Поднимаем ssh-сервер.
Linux:
sudo apt install openssh-server
sudo service ssh start

Win10/11:
пуск - настройки - приложения - дополнительные функции -
(run - settings - apps - optional features)
Ищем там OpenSSH. Если у вас есть OpenSSH Server - все ок. Если нет, идем в
пуск - настройки - приложения - приложения и функции -
(run - settings - apps - apps&features)
ищем OpenSSH и ставим OpenSSH Server.

После установки:
пуск - службы - OpenSSH Server - запустить
(run - services - openssh server - start)

7. На локальной машине: ставим клиент OpenSSH. (через пуск - настройки - приложения - приложения и функции или run - settings - apps - apps&features)

8. В консоли пишем:
ssh <username>@<ngrok external address> -p <ngrok port> -L 8888:localhost:8888
Где <username> - это имя пользователя удаленной машины, <ngrok external address> и <port> - те, которые вы получаете при запуске ngrok сервера в пункте №5.

9. Введите пароль вашего удаленного пользователя.

10. Подключаем колаб через connect -> connect to local runtime

@derplearning
🔥207😱3🤩1
Forwarded from Dev Meme / devmeme
😁46