NEW BOT Телеграм, страница

Gemini Image Editing NextJS Quickstart

Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash

Вот например в Freepik уже прикручено

Демо, и даже без впн
Код

#assistant #mlm #vlm #imageediting #text2image

❤4🔥1

1.97K views17:16

Нейронавт | Нейросети в творчестве

Проверьте почту если записывались в вейтлист Mago

Не уверен что такой перенос стиля на видео будет актуален при всех возможностях видеогенераторов которые нам уже доступны.

Но посмотрим что сможет предложить Mago

#news #styletransfer

👍1

1.84K views18:48

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Virtual Camera (Seva): Multi-View Video Generation with 3D Camera Control

Генератор видео по картинке с контролем камеры от Stability AI. На вход от 1 до 32 картинок. Камера идет по заданной пользователем траектории

1.3B параметров

Обещают консисентность вплоть до бесшовного зацикливания если камера возвращается в ту же точку. Причем 1000 кадров как с куста

Код
Демо

#cameracontrol #image2video #image2scene #novelview

🔥8👍4❤1

1.97K viewsedited 09:38

Нейронавт | Нейросети в творчестве

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

gemini-codrawing

Вангую что таких демок будет много. Сертифицированная точность вангования как всегда 50/50

#sketch2image #text2image #text2drawing #text2sketch

❤9💯2

2.03K viewsedited 12:42

Нейронавт | Нейросети в творчестве

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini Canvas

В чатбот Гугла прикрутили Canvas для работы с кодом, коллаборациями (и наверно чем-то еще)

Бонусом, сделали Audio Overview - подкаст-обзор на основе загруженных документов. Короче, похоже, просто прикрутили NotebookLM

Попробовать - притворитесь что вы не в РФ

#text2podcast #coding #canvas #assistant

🔥8😎2

1.86K views15:29

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Lluminate

Интересная работа

Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.

Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.

Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.

Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.

Код

#text2image

👍7❤3

1.67K views07:53

Нейронавт | Нейросети в творчестве

Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image

👍8🔥3❤1

1.9K views08:23

Нейронавт | Нейросети в творчестве

From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization

👀4👍2🔥1

1.85K views08:53

Нейронавт | Нейросети в творчестве

Wan2GP v2

Обновился Wan2.1 GP, много улучшений
Удобная установка в Pinokio

#text2video #image2video

👍8🔥1

1.9K views09:13

Нейронавт | Нейросети в творчестве

1:16

Media is too big

VIEW IN TELEGRAM

Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images

Реконструкция частично видимых 3D объектов по картинке

Код ждем
Демо

#imageto3d

👍3🔥1

1.87K views09:43

Нейронавт | Нейросети в творчестве

Grok в Телеграм, не реклама

В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию

Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер

Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться 🧐

#news #bot #assistant #тестбендера

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

2.02K viewsedited 09:59

Нейронавт | Нейросети в творчестве

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video

🔥9

2.27K views15:59

Нейронавт | Нейросети в творчестве

OpenAI.fm

Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет

Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"

#news #text2speech #speech2text

👍5😁4

2.1K views07:13

Нейронавт | Нейросети в творчестве

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)

Держите еще один персонализатор от ByteDance

Совместим с Flux и другими DIT.

Обещают высокую идентичность при сохранении возможностей генерации

Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики

Совместим с Controlnet, Lora и другими плагинами

Код
Демо - ждем, 404
Веса

#personalization #referencing #text2image

👍9👎2

2.19K views07:55

Нейронавт | Нейросети в творчестве

2:06

This media is not supported in your browser

VIEW IN TELEGRAM

Cosmos-Transfer1: World Generation with Adaptive Multimodal Control

Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)

Гитхаб

#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video

👍3🔥2🤔1

1.96K views08:25

Нейронавт | Нейросети в творчестве

2:03

This media is not supported in your browser

VIEW IN TELEGRAM

VGGT: Visual Geometry Grounded Transformer

Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.

На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.

Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях

Код
Демо

#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth

👍3🔥1

2K views09:04

About

Blog

Apps

Platform