Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Самое важное о чем я не успел вам рассказать на прошлой неделе

Groq
- самая быстрая альтернатива ChatGPT, быстый - 500 токенов/сек

Chateq - чатбот спорщик, поможет спорить в интернете

Pika научился делать липсинк. Загружаем запись речи и получаем видео с говорящим персонажем

Suno.ai V3 научился генерить музыку без вокала с отменным качеством, до 2 минут

Adobe анонсировали Project Music GenAI Control - генератор/редактор аудио с помощью текстовых указаний.

#llm #assistant #chatbot #news #lipsync #text2music #music2music #audio2aidio
👍4
Differential Diffusion: Giving Each Pixel Its Strength

Контроль количества изменений на сгенерированных изображениях на пиксель или на область изображения.

Интегрируется в существующие генераторы изображений, работает без обучения.

Код
Колаб
Демо

#image2image
🔥9👍3
Forwarded from Сиолошная
This media is not supported in your browser
VIEW IN TELEGRAM
Помните я писал про секретный анонс фичи Gemini, который никто не продвигал, был лишь один ролик? Вот тут: https://news.1rj.ru/str/seeallochnaya/911, суть в том, что под каждый запрос LLM генерирует код интерфейса, в котором нужно показывать пользователю ответ, а затем уже его наполняет.

Vercel, компания, предоставляющая облачный сервис для развёртывания сайтов, обновила AI SDK до версии 3.0, добавив туда такую фичу. Формочки на демо не предзапрограммированны, а создаются на лету и могут содержать любой контент в любой форме. Думаю, что через пару лет такая персонализация будет широко распространена — особенно с учётом количества пользователей, на которых можно запускать A/B тесты и оптимизировать интерфейс до мельчайших деталей. И главное программисты, перекрашивающие годами две кнопки, будут не нужны!
🔥2🤔1
Anthropic релизнули Claude 3, в трех вариантах - Opus, Sonnet и Haiku. Opus и Sonnet доступны уже сейчас, а Haiku - в ближайшие недели. Для россиян все еще по VPN

По цифрам на приборах обходит GPT-4.
Теперь ему можно скармливать картинки.
Контекст 200k токенов

Попробовать Claude 3 Sonnet (включайте VPN)

#news #assistant #vlm
👍11
Stability.ai опубликовали пейпер Stable Diffusion 3

Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту

Блог
Пейпер

#news #SD
🔥9👍1😁1
Auto 1111 SDK: Stable Diffusion Python library

В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.

Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта

Колаб

#tools #coding
👍7
TripoSR: Fast 3D Object Generation from Single Images

Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai

Генерация меньше чем за секунду. Работает даже без GPU. Революция?

Код/веса
Демо

#textto3D
🔥8
ComfyUI-Flowty-TripoSR

А вот и нода для ComfyUI.
Говорят, видеопамяти жрет 1.6 GB

#textto3D
🔥12😁6
ResAdapter : Domain Consistent Resolution Adapter for Diffusion Models

Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA

Код

#text2image
👍13
Trajectory Consistency Distillation

Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.

Ускорение инференса при высоком качестве и детальности.

Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma

Код
Демо

#text2image
🔥6
3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos

На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)

Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду

Код ожидается в июне 2024, но это неточно

#novelveiw #rendering #stabilization #video2video #video2scene #FVV
👍2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
AtomoVideo:High Fidelity Image-to-Video Generation

Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет

#image2video
👍4