Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Появилась демка адаптера материалов ZeST
Го тестить

Демо

#material #image2image
😁7🥴2🤯1
ImageInWords: Unlocking Hyper-Detailed Image Denoscriptions

Инструмент для гипердетального описания изображений от Google/Deepmind. Есть демоспейс для просмотра датасетов и гитхаб, но нет кода и свое изображение на пробу загрузить некуда.

Потенциальная польза - датасеты применят для обучения генераторов и кэпшонеров. Ну а вдруг и кодом поделятся

Гитхаб
Просмотр датасета
Скачать датасет

#image2text
👍5
DeepSeek-V2

Давно не было новостей для кодеров. Держите.

Обновился Deepseek coder

- Занимает 3-е место в рейтинге AlignBench, превосходя GPT-4 и приближаясь к GPT-4 Turbo.
- Занимает первое место в рейтинге MT-Bench, конкурируя с LLaMA3-70B и превосходя Mixtral 8x22B.
- Специализируется на математике, коде и логических выводах.
- контекстное окно: 128 К (модель с открытым исходным кодом) / 32 К (онлайн-сервис)

Обещают после подтверждения номера телефона дать 5млн бесплатных токенов на платформе

Попробовать в режиме чата
Модель (для владельцев 100500 GB VRAM)

#coding #llm #chatbot #assistant
5
This media is not supported in your browser
VIEW IN TELEGRAM
OpenDevin

Попытка сделать опенсорсный аналог Devin
Запускается в Docker'е

Гитхаб

#coding #assistant
👍9
Salient Object-Aware Background Generation using Text-Guided Diffusion Models

Инпейнтинг с сохранением границ объекта от Yahoo. Суть проблемы видна на картинке. Обычный SD инпейнтинг что-то дорисовывает к объекту который должен остаться неизменным

Код

#inpainting #image2image
5🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
im-a-good-gpt2-chatbot появился в сравнительной части chat.lmsys.org

chat.lmsys.org — сейчас арена для теста лучших LLM, и арт вроде должен быть далеко от этого. Но я недавно узнал у Сиолошной про im-a-good-gpt2-chatbot, говорят это проделки OpenAI.

В общем я решил использовать старые промпты для P5JS (Помните был такой Генарт? Когда с помощью кода создают красоту)
И im-a-good-gpt2-chatbot показал невероятное понимание как создать, анимировать и даже визуализировать объекты. В моем случае я попросил создать симуляцию столкновения двух нейтронных звезд и примерно рассчитать масштаб черной дыры и визуально показать ее. Очень хорошо видеть в сравнение со второй рандомной(Qwen и gemini-1.5-pro-api-0409-preview) моделью, как im-a-good-gpt2-chatbot превосходит другие модели и выдает рабочий, сложный код.

Пока я прошу перевести код в Blender API(что он тоже прекрасно делает) поглядите на симуляцию столкновения двух нейтронных звезд одинакового размера.

А Денис успел раньше игру запилить.

P.S. Модель хорошо сгенерировала noscript вариант текстового сторис для инсты и даже запилила полноценный код с использования controlnet и кастомных моделей в diffusers. Это очень мощно.
👍8
IC-Light

Новая полезная тулза от автора Controlnet, Fooocus, Forge!

Релайтинг изображений, вписывание объекта в фон по свету. При том, что модель не обучалась на нормалях, она выдает нормали качественнее чем Geowizard и Switchlight (судя по примерам на гитхабе)

Код
Демо

#relighting #image2image
🔥21👍1
This media is not supported in your browser
VIEW IN TELEGRAM
STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians

И снова динамические гауссианы. "Высокоточная" генерация динамических 3D объектов по тексту, изображению или видео. О как.

Код

#novelveiw #rendering #videoto3D #imageto3D #textto3D
👍31
Состязание роботов-гитаристов продолжается.

Elevenlabs показали свой генератор песен. Надо признать, бомбический. Доступ ждем здесь

Генератор песен Udio теперь умеет создавать треки продолжительностью до 15 минут и может «держать в уме» контекст 2 минут трека (ранее только 30 сек) и добавил функцию инпейнтига (но только для оплативших подписку), позволяя менять слова в песне, добавлять инструменты, или исправлять проблемные места.

#text2music #music2music #inpainting
👍13🔥1
Media is too big
VIEW IN TELEGRAM
Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers

Убийца... ВСЕГО.

Ладно, это преувеличение. Всего лишь мультимодальный преобразователь текста в картинки, видео, речь, 3D модели.

Умеет (см видео)
- создавать заданную композицию
- консистентно генерировать в заданном стиле
- креативный апскейл
- редактировать изображения

Код
Веса
Демо (генератор картинок)

#upscale #text2image #text2video #text2speech #textto3D #imageediting #image2image #multimodal
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
Stylar

Ловите еще один онлайн ИИ-редактор изображений. В нем есть #SD3 и Generative Fill/Generative Expand.
Дают 200 кредитов в месяц для бесплатного пользования. 4 кредита = один батч на 4 картинки или 1 батч 2 варианта дорисовки.

#imageediting #inpainting #outpainting
👍11