Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Gemini Image Editing NextJS Quickstart

Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash

Вот например в Freepik уже прикручено

Демо, и даже без впн
Код

#assistant #mlm #vlm #imageediting #text2image
4🔥1
Проверьте почту если записывались в вейтлист Mago

Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.

Но посмотрим что сможет предложить Mago

#news #styletransfer
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Virtual Camera (Seva): Multi-View Video Generation with 3D Camera Control

Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории

1.3B параметров

Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста

Код
Демо

#cameracontrol #image2video #image2scene #novelview
🔥8👍41
This media is not supported in your browser
VIEW IN TELEGRAM
gemini-codrawing

Вангую что таких демок будет много. Сертифицированная точность вангования как всегда 50/50

#sketch2image #text2image #text2drawing #text2sketch
9💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Canvas

В чатбот Гугла прикрутили Canvas для работы с кодом, коллаборациями (и наверно чем-то еще)

Бонусом, сделали Audio Overview - подкаст-обзор на основе загруженных документов. Короче, похоже, просто прикрутили NotebookLM

Попробовать - притворитесь что вы не в РФ

#text2podcast #coding #canvas #assistant
🔥8😎2
This media is not supported in your browser
VIEW IN TELEGRAM
Lluminate

Интересная работа

Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.

Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.

Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.

Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.

Код

#text2image
👍73
Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image
👍8🔥31
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization
👀4👍2🔥1
Wan2GP v2

Обновился Wan2.1 GP, много улучшений
Удобная установка в Pinokio

#text2video #image2video
👍8🔥1
Media is too big
VIEW IN TELEGRAM
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images

Реконструкция частично видимых 3D объектов по картинке

Код ждем
Демо

#imageto3d
👍3🔥1
Grok в Телеграм, не реклама

В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию

Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер

Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться 🧐

#news #bot #assistant #тестбендера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video
🔥9
OpenAI.fm

Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет

Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"

#news #text2speech #speech2text
👍5😁4
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)

Держите еще один персонализатор от ByteDance

Совместим с Flux и другими DIT.

Обещают высокую идентичность при сохранении возможностей генерации

Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики

Совместим с Controlnet, Lora и другими плагинами

Код
Демо - ждем, 404
Веса

#personalization #referencing #text2image
👍9👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Transfer1: World Generation with Adaptive Multimodal Control

Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)

Гитхаб

#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video
👍3🔥2🤔1
VGGT: Visual Geometry Grounded Transformer

Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.

На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.

Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях

Код
Демо

#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth
👍3🔥1