This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
CogVideoX 5B
Я уже писал про CogVideoX, и вот вся лента завалена выпущенной вчера моделью 5B.
Работает даже на 12ГБ VRAM (не проверял), конкурирует с коммерческими лидерами
Го тестить!
Демо
tost.ai (она там есть)
Колаб
ComfyUI (в разработке)
#text2video
Я уже писал про CogVideoX, и вот вся лента завалена выпущенной вчера моделью 5B.
Работает даже на 12ГБ VRAM (не проверял), конкурирует с коммерческими лидерами
Го тестить!
Демо
tost.ai (она там есть)
Колаб
ComfyUI (в разработке)
#text2video
🔥10❤1
Нейронавт | Нейросети в творчестве
Vidu Видеогенератор от китайцев, сопоставимый с Sora Есть только статья на китайском 🇨🇳 #text2video #news
Vidu
Видеогенератор обзавелся сайтом, где можно генерить видео по тексту и по картинке.
Говорят, хорошо держит консистентность персонажа с картинки.
Есть улучшайзер-рандомайзер промпта, API.
На старте выдают 80 кредитов, их хватит на 10 четырехсекундных видео с апскейлом. Можно делать 8-секундные.
Го тестить!
#text2video #image2video
Видеогенератор обзавелся сайтом, где можно генерить видео по тексту и по картинке.
Говорят, хорошо держит консистентность персонажа с картинки.
Есть улучшайзер-рандомайзер промпта, API.
На старте выдают 80 кредитов, их хватит на 10 четырехсекундных видео с апскейлом. Можно делать 8-секундные.
Дуров сбегает из Франции
Го тестить!
#text2video #image2video
👍8😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Generative Inbetweening: Adapting Image-to-Video Models for Keyframe Interpolation
Новый интерполятор кадров от Google DeepMind. Посмотрите на сайте насколько он круче FILM. Из двух кадров делает видео
А почему они не сравнили его со своим же VIDIM?
Код
#frameinterpolation #slowmotion
Новый интерполятор кадров от Google DeepMind. Посмотрите на сайте насколько он круче FILM. Из двух кадров делает видео
А почему они не сравнили его со своим же VIDIM?
Код
#frameinterpolation #slowmotion
❤10👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Splatt3R
Демоспейс для создания 3d сцены на гауссианах по всего двум ракурсам. Если у вас есть одна картинка, второй ракурс можно сгенерить видеогенератором, как сделали на реддите
Например в Runway ML Gen3-Turbo промпт: "Orbit Right"
#gaussian #image2gaussian #image2scene #imageto3d
Демоспейс для создания 3d сцены на гауссианах по всего двум ракурсам. Если у вас есть одна картинка, второй ракурс можно сгенерить видеогенератором, как сделали на реддите
Например в Runway ML Gen3-Turbo промпт: "Orbit Right"
#gaussian #image2gaussian #image2scene #imageto3d
❤8👍1
Towards Realistic Example-based Modeling via 3D Gaussian Stitching
3D-моделирование гауссианами на основе примеров.
Наконец что-то с контролем результата и GUI.
Рабочий процесс состоит из трех этапов:
1) сегментация и преобразование гауссовой модели в реальном времени с использованием GUI
2) анализ KNN для определения граничных точек в области пересечения исходной и целевой моделей
3) двухфазная оптимизация целевой модели с использованием клонирования на основе выборки и градиентных ограничений.
Если вы чего-то не поняли в этом описании, я тоже. Гляньте видео, там примерно видно процесс
Код ждем
#imageto3d #modeling #photogrammetry #gaussian #image2gaussian
3D-моделирование гауссианами на основе примеров.
Наконец что-то с контролем результата и GUI.
Рабочий процесс состоит из трех этапов:
1) сегментация и преобразование гауссовой модели в реальном времени с использованием GUI
2) анализ KNN для определения граничных точек в области пересечения исходной и целевой моделей
3) двухфазная оптимизация целевой модели с использованием клонирования на основе выборки и градиентных ограничений.
Если вы чего-то не поняли в этом описании, я тоже. Гляньте видео, там примерно видно процесс
Код ждем
#imageto3d #modeling #photogrammetry #gaussian #image2gaussian
🔥8👍3
Опубликован код реставратора-апскейлера лиц на видео KEEP
Свое видео в демке обработать не удалось - выдает пустые видео.
Вероятно, надо предварительно кропнуть и выровнять лицо.
Видно что кипят волосы, лицо тоже подкипает. Надеюсь прикрутят рульку силы эффекта
Код
Демо
#restoration #enhance #facerestoration #upscale
Свое видео в демке обработать не удалось - выдает пустые видео.
Вероятно, надо предварительно кропнуть и выровнять лицо.
Видно что кипят волосы, лицо тоже подкипает. Надеюсь прикрутят рульку силы эффекта
Код
Демо
#restoration #enhance #facerestoration #upscale
👍4👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Edit
В Resemble AI прикрутили редактирование звука речи через редактирование текста. В помощь живым запинающимся дикторам. Да, вот так как нам показывали Adobe 7 лет назад. Или что там, в премьер уже встроили эту фичу?
#speechediting #audioediting #text2speech #speech2speech
В Resemble AI прикрутили редактирование звука речи через редактирование текста. В помощь живым запинающимся дикторам. Да, вот так как нам показывали Adobe 7 лет назад. Или что там, в премьер уже встроили эту фичу?
#speechediting #audioediting #text2speech #speech2speech
👍5🤯4
Forwarded from Data Secrets
Это примерно 10 миллионов строк кода или 750 романов. Для сравнения, до этого рекордсменом по длине контекста был Gemini с 1M токенов, и даже это число произвело когда-то на презентации Google фурор.
Иронично, но модель называется LTM-2-Mini. LTM – это сокращение от Long-Term Memory. Эта архитектура не использует attention, и за счет этого контекстное окно в 100М ей обходится примерно в 1000 раз дешевле, чем, например, той же Llama 3.1 405B. А с памятью еще круче: если Llama потребовала бы 638 H100s на юзера только чтобы хранить KV кэш, то LTM требуется всего часть HBM одной видеокарты.
Бенчмарков пока нет, но в Magic уже заключили партнерство на кластер с Google Cloud и говорят, что прямо сейчас обучают бОльшую версию LTM-2 на суперкомпьютере
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎃3👍1
Forwarded from Data Secrets
Инженер из Сан-Франциско провел интересный эксперимент и выяснил, что Claude якобы склонен к самосознанию
Экспериментатор попросил модель нарисовать самого себя, а также ChatGPT и Gemini, а затем показал эти рисунки другой версии Клода и попросил указать на автопортрет. И модель внезапно узнала себя. Потом эксперимент запустили еще раз и еще. В итоге Клод узнал свой портрет в 7/8 случаев!
Но и это не вся история. Парень также попросил ChatGPT нарисовать аналогичные портреты, а потом снова показал их Клоду. При этом он соврал, что портреты якобы опять нарисовал другой экземляр Claude, на что модель внезапно заявила: "Нет, я не рисовал это"😅
Экспериментатор попросил модель нарисовать самого себя, а также ChatGPT и Gemini, а затем показал эти рисунки другой версии Клода и попросил указать на автопортрет. И модель внезапно узнала себя. Потом эксперимент запустили еще раз и еще. В итоге Клод узнал свой портрет в 7/8 случаев!
Но и это не вся история. Парень также попросил ChatGPT нарисовать аналогичные портреты, а потом снова показал их Клоду. При этом он соврал, что портреты якобы опять нарисовал другой экземляр Claude, на что модель внезапно заявила: "Нет, я не рисовал это"
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁27👍6😐5👎4
Еще один бот от подписчика. Работает за подписку на канал. За картинку не бейте, что на ум пришло.
Описание от автора бота:
Всем привет!
Я в качестве pet-проекта сделал Telegram бота для генерации изображений и текста.
Планирую его расширять, добавляя новые инструменты.
На данный в нем уже можно делать всякие прикольные штуки:
1. Генерировать изображения на основе текстового описания (под капотом SDXL). Flux пока не добавил, но планирую.
2. Стилизовать свой портрет, превращая себя в кого угодно, хоть в принцессу, хоть в супергероя.
3. Заменять фон на фото. В этом случае человек остается неизменным, а фон меняется.
4. Работать с текстом. Суммаризировать текст, переписывать и тому подобное.
В ближайших планах добавить удаление фона (вырезание объекта).
Сам бот здесь https://news.1rj.ru/str/everyone_ai_bot. Все бесплатно. Заходите 😊
#bot
Описание от автора бота:
Всем привет!
Я в качестве pet-проекта сделал Telegram бота для генерации изображений и текста.
Планирую его расширять, добавляя новые инструменты.
На данный в нем уже можно делать всякие прикольные штуки:
1. Генерировать изображения на основе текстового описания (под капотом SDXL). Flux пока не добавил, но планирую.
2. Стилизовать свой портрет, превращая себя в кого угодно, хоть в принцессу, хоть в супергероя.
3. Заменять фон на фото. В этом случае человек остается неизменным, а фон меняется.
4. Работать с текстом. Суммаризировать текст, переписывать и тому подобное.
В ближайших планах добавить удаление фона (вырезание объекта).
Сам бот здесь https://news.1rj.ru/str/everyone_ai_bot. Все бесплатно. Заходите 😊
#bot
👍18🔥6🤮4❤2
Это аттракцион щедрости. Когда человек сделал чтото полезное и предлагает воспользоваться бесплатно, почему бы мне о таком не рассказать
👍17💯6🤔5👏3🎃2