NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Опубликован код 3DGStream. Рефакторизованный код выложат после CVPR 2024

Код

#novelveiw #rendering #stabilization #video2video #video2scene #FVV

0:09

Нейронавт | Нейросети в творчестве

3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos

На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering…

❤3

1.47K views13:14

Нейронавт | Нейросети в творчестве

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians

И снова динамические гауссианы. "Высокоточная" генерация динамических 3D объектов по тексту, изображению или видео. О как.

Код

#novelveiw #rendering #videoto3D #imageto3D #textto3D

👍3❤1

1.94K views13:43

Нейронавт | Нейросети в творчестве

IC-Light Новая полезная тулза от автора Controlnet, Fooocus, Forge! Релайтинг изображений, вписывание объекта в фон по свету. При том, что модель не обучалась на нормалях, она выдает нормали качественнее чем Geowizard и Switchlight (судя по примерам на гитхабе)…

IC-Light прикрутили в ComfyUI

ComfyUI-IC-Light-Wrapper

#relighting #image2image

GitHub

GitHub - lllyasviel/IC-Light: More relighting!

More relighting! Contribute to lllyasviel/IC-Light development by creating an account on GitHub.

👍6🔥3

1.58K views12:04

Нейронавт | Нейросети в творчестве

2:59

This media is not supported in your browser

VIEW IN TELEGRAM

2:50

This media is not supported in your browser

VIEW IN TELEGRAM

2:59

This media is not supported in your browser

VIEW IN TELEGRAM

2:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Состязание роботов-гитаристов продолжается.

Elevenlabs показали свой генератор песен. Надо признать, бомбический. Доступ ждем здесь

Генератор песен Udio теперь умеет создавать треки продолжительностью до 15 минут и может «держать в уме» контекст 2 минут трека (ранее только 30 сек) и добавил функцию инпейнтига (но только для оплативших подписку), позволяя менять слова в песне, добавлять инструменты, или исправлять проблемные места.

#text2music #music2music #inpainting

👍13🔥1

1.83K views12:33

Нейронавт | Нейросети в творчестве

2:25

Media is too big

VIEW IN TELEGRAM

Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers

Убийца... ВСЕГО.

Ладно, это преувеличение. Всего лишь мультимодальный преобразователь текста в картинки, видео, речь, 3D модели.

Умеет (см видео)
- создавать заданную композицию
- консистентно генерировать в заданном стиле
- креативный апскейл
- редактировать изображения

Код
Веса
Демо (генератор картинок)

#upscale #text2image #text2video #text2speech #textto3D #imageediting #image2image #multimodal

🔥12

2.02K views13:40

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stylar

Ловите еще один онлайн ИИ-редактор изображений. В нем есть #SD3 и Generative Fill/Generative Expand.
Дают 200 кредитов в месяц для бесплатного пользования. 4 кредита = один батч на 4 картинки или 1 батч 2 варианта дорисовки.

#imageediting #inpainting #outpainting

👍11

1.96K views14:18

Нейронавт | Нейросети в творчестве

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images

Устранение размытости на видео на основе гауссиан

Код

#deblur #gaussian

👍15

1.71K views09:29

Нейронавт | Нейросети в творчестве

Progress Tracker: Open vs. Proprietary LLMs

Демоспейс с визуализацией прогресса #LLM с проприетарным и открытым исходным кодом по данным чатбот арены

#news #diagram

👍1

1.58K views09:47

Нейронавт | Нейросети в творчестве

LLaVA-NeXT: Open Large Multimodal Models

Языковая модель для понимания видео, превосходящая все существующие #VLM, с открытым исходным кодом.

Код
Демо (изображения)
Демо (видео) (сейчас выдает ошибку хоста)

#LLM

👍3

1.5K views10:34

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ID-Animator: Zero-Shot Identity-Preserving Human Video Generation

Персонализатор-аниматор от Tencent. Создает анимации с заданным лицом.

Код
Демо

#personalization #text2video

👍5❤2🔥2

1.6K views10:50

Нейронавт | Нейросети в творчестве

Gazelle v0.2

Инновационная open source речевая модель от TincansAI. Способна обрабатывать устные запросы и длинные аудиофайлы напрямую, без предварительной транскрипции или распознавания речи.

Благодаря прямой обработке аудиоданных, модель работает быстрее и точнее, а также способна интерпретировать эмоции и даже сарказм в речи. Код “из коробки” достигает скорости 120 миллисекунд до первого токена, что значительно быстрее, чем любой другой сопоставимый подход.

Это первая и единственная open source модель, способная вести диалог в реальном времени.

Код
Демо

#speech2text #audio2text #assistant

🔥15

1.7K views18:13

Нейронавт | Нейросети в творчестве

#humor

😁45❤2

1.6K views07:01

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

This media is not supported in your browser

VIEW IN TELEGRAM

Today is the Day! Вечером смотрим презентацию OpenAI (17:00 UTC, 20:00 MSK)

Многие сотрудники компании пишут, что они очень взволнованы (в позитивном смысле). Честно говоря не помню такого нагона хайпа ни на ноябрьский DevDay, ни при релизе GPT-4 (работали поди, хех).

Рабочая версия того, что покажут — голосового AI-ассистента, который умеет распознавать эмоции в голосе, а также сам меняет интонацию в зависимости от контекста. Возможно, ключевым отличием нового продукта (помимо голосовых функций) станет низкая задержка — у людей будет создаваться ощущение, что они общаются с человеком, а не машиной. Также ходят слухи, что будут и видео-звонки с аватаром.

Ждём вечера 👍 все обновления буду писать в канал, а вы не забывайте скачать бинго-карточку, чтоб было интереснее смотреть

UPD: только сейчас понял, что OpenAI тоже всё перенесли на...после майских!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥2🌚1

1.27K views07:23

Нейронавт | Нейросети в творчестве

в 20:00 смотрите трансляцию OpenAI

#news

YouTube

Introducing GPT-4o

OpenAI Spring Update – streamed live on Monday, May 13, 2024.

Introducing GPT-4o, updates to ChatGPT, and more.

1.47K views16:48

Нейронавт | Нейросети в творчестве

Forwarded from Эксплойт

Коротко о главном с презентации OpenAI:

— Новая модель GPT4 Omni, бесплатно для всех пользователей;
— Лучше базовой GPT-4 во всём, особенно в кодинге;
— Все фишки платных подписчиков будут доступны бесплатно;
— Полноценный голосовой ассистент, которого не отличить от человека;
— С помощью ассистента можно переводить речь с другого языка!

Только что OpenAI выкатила модель, без которой теперь не справится ни один работяга.

@exploitex

👍7❤1

1.37K views17:41

About

Blog

Apps

Platform