This media is not supported in your browser
VIEW IN TELEGRAM
Пока ChatGPT прилег, Anthropic презентовали Claude 2.1
- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2
#chatbot #assistant #LLM
- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2
#chatbot #assistant #LLM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Video Diffusion
Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.
Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров
Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.
Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров
Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
👍3
Forwarded from Соне нравится (или нет)
Наша команда трудилась-трудилась и выкатила две крупные (во всех смыслах) модели в релиз! 😧
➡️ ➡️ ➡️ Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео
Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.
Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned.🦔
Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.
Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned.
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Kandinsky 3.0 — новая модель генерации изображений по тексту
«Без чувства современности художник останется непризнанным» , Михаил Пришвин, русский и советский писатель, прозаик и публицист В прошлом году на АI Journey мы представили модель Kandinsky 2.0 —...
🔥6
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:
Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥4❤1👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab
Говорят, превосходит Whisper
- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка
Демо
Колаб
#speech2text #translation #speech2speech #voice2text
Говорят, превосходит Whisper
- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка
Демо
Колаб
#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models
А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.
Код
Примеры
Демо (надеюсь, починят)
Колаб
#text2speech
А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.
Код
Примеры
Демо (надеюсь, починят)
Колаб
#text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
PhysGaussian: Physics-Integrated 3D Gaussians for Generative Dynamics
А вот в гауссианы завезли физику. В нерфы уже завозили, но пока не видел кейсов использования. Надеюсь, с гауссианами взлетит.
Пишут что можно управлять динамикой через свойства материалов
Код обещают выложить
#dynamics #gaussian #imageto3D
А вот в гауссианы завезли физику. В нерфы уже завозили, но пока не видел кейсов использования. Надеюсь, с гауссианами взлетит.
Пишут что можно управлять динамикой через свойства материалов
Код обещают выложить
#dynamics #gaussian #imageto3D
👍1
Media is too big
VIEW IN TELEGRAM
runway.tv
Это о**енно!
Помните в Рик и Морти было ТВ из других миров? Вот спасибо Runway, у нас теперь есть: runway.tv
Просто бесконечный стрим коротких #text2video фильмов. Сами по себе отдельные ролики нас уже не впечатлят. Но все это в видео ТВ - новый уровень и другие ощущения
Новость подсмотрел у Дениса
#streaming #tv #news
Это о**енно!
Помните в Рик и Морти было ТВ из других миров? Вот спасибо Runway, у нас теперь есть: runway.tv
Просто бесконечный стрим коротких #text2video фильмов. Сами по себе отдельные ролики нас уже не впечатлят. Но все это в видео ТВ - новый уровень и другие ощущения
Новость подсмотрел у Дениса
#streaming #tv #news
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Google Bard научился смотреть видео на YouTube и пересказывать их. Можно попросить его показать подборку видео на тему, обсудить содержимое видео. Ну и другие расширения у Bard тоже есть. Для россиян через VPN
Говорят, что видео он не понимает, тупо читает титры
#assistant #chatbot #VLM #multimodal
Говорят, что видео он не понимает, тупо читает титры
#assistant #chatbot #VLM #multimodal
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
А вы заметили что уже есть сопособы затестить Stable Video Diffusion онлайн?
Ссылки прилагаю внизу поста.
Я затестил и уже сделал несколько выводов.
Самое главное:
он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
Ссылки прилагаю внизу поста.
Я затестил и уже сделал несколько выводов.
Самое главное:
он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
😁2👍1