В установщике нейросетей Pinokio уже доступны:
Кастомизатор картинок UNO
Голосовая модель DIA
Видеогенератор для бедных FramePack
И многие другие инструменты
За напоминание спасибо @Dmitriy_Ru6ts0v
#image2video #tts #personalization #referencing
Кастомизатор картинок UNO
Голосовая модель DIA
Видеогенератор для бедных FramePack
И многие другие инструменты
За напоминание спасибо @Dmitriy_Ru6ts0v
#image2video #tts #personalization #referencing
pinokio.co
Pinokio: The 1-Click Localhost Cloud
Run your own personal Internet on Mac, Windows, and Linux with one click.
❤8👍6
Skyreels 14B V2 720P
Веса модели видеогенератора появились на официальном HF
И уже квантизованные в репозитории Kijai
#image2video
Веса модели видеогенератора появились на официальном HF
И уже квантизованные в репозитории Kijai
#image2video
huggingface.co
Skywork/SkyReels-V2-I2V-14B-720P at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍4❤2
Картинки, видео и языковые модели - большая тройка направлений, которыми интересуюсь я и мои подписчики (иначе зачем бы вы на меня подписывались)
Три научных статьи в этих областях с участием Артема - и все три получили награды, две CVPR25 и одна ICLR25
Вангую, Через пару месяцев, мы будем пробовать новые более быстрые, более умные, более точные нейросетки, основанные на этих статьях. Хотя одна из них с открытым кодом, и можно посмотреть уже сейчас.
1) Дистилляция (ускорение) диффузии (большинство генераторов картинок и все видеогенераторы работаю на диффузии) в 3-4 шага
2) Как запускать генерацию картинок и видео на 80%, 60% или даже 40% компьюта с минимальными потерями в качестве
3) Ускорили Llama-3.1 405B в 9 раз, практически без потерь в качестве
Простым языком из первых рук читайте у Артема. Накидайте там поздравлений или хотя бы огоньков команде, люди делают наше будущее
эйай ньюз - подписывайтесь!
Три научных статьи в этих областях с участием Артема - и все три получили награды, две CVPR25 и одна ICLR25
Вангую, Через пару месяцев, мы будем пробовать новые более быстрые, более умные, более точные нейросетки, основанные на этих статьях. Хотя одна из них с открытым кодом, и можно посмотреть уже сейчас.
1) Дистилляция (ускорение) диффузии (большинство генераторов картинок и все видеогенераторы работаю на диффузии) в 3-4 шага
2) Как запускать генерацию картинок и видео на 80%, 60% или даже 40% компьюта с минимальными потерями в качестве
3) Ускорили Llama-3.1 405B в 9 раз, практически без потерь в качестве
Простым языком из первых рук читайте у Артема. Накидайте там поздравлений или хотя бы огоньков команде, люди делают наше будущее
эйай ньюз - подписывайтесь!
Telegram
эйай ньюз
Мини-отчет о моих свеже-опубликованных статьях. Этот год выдался очень продуктивным и мы сильно попотели нашим статьям очень повезло. В итоге у нас 3/3 статей принято на топовые конференции, и все три получили дополнительные awards. Я работал в основном…
👌6❤3👍3
Немножко #news
Давно заходили на Civitai.com?
Куда-то исчезли все срамные картинки с главной страницы. По поиску срамные модели еще можно найти, но они исчезают одна за другой, фурри-фетишисты обеспокоены. Да и с онлайн тренировкой моделей стало сложнее.
Согласно мнению реддитора, CivitAI не виноват.
Проблема связана с Visa и ограничениями, которые она накладывает на компании, принимающие её карты. Visa требует от компаний, работающих с искусственным интеллектом, применять цензуру, иначе они не смогут обрабатывать платежи.
Есть ряд альтернатив, которые еще не настолько популярны чтобы ощутить давление Visa
Сохраняем, пользуемся:
Tensor.art - прямой конкурент
Huggingface.com - репозиторий ИИ-разработчиков, "магазин ИИ-приложений"
Prompthero.com - этот у меня работает только с вэпээн
Pixai.art - хвалят за скорость и удобство по сравнению с Civitai
Seaart.ai - еще один неплохой конкурент
thinkdiffusion.com - генерация ИИ-арта в браузере с контролнетами
#text2image #gallery #online #tools #nsfw
Давно заходили на Civitai.com?
Куда-то исчезли все срамные картинки с главной страницы. По поиску срамные модели еще можно найти, но они исчезают одна за другой, фурри-фетишисты обеспокоены. Да и с онлайн тренировкой моделей стало сложнее.
Согласно мнению реддитора, CivitAI не виноват.
Проблема связана с Visa и ограничениями, которые она накладывает на компании, принимающие её карты. Visa требует от компаний, работающих с искусственным интеллектом, применять цензуру, иначе они не смогут обрабатывать платежи.
Есть ряд альтернатив, которые еще не настолько популярны чтобы ощутить давление Visa
Сохраняем, пользуемся:
Tensor.art - прямой конкурент
Huggingface.com - репозиторий ИИ-разработчиков, "магазин ИИ-приложений"
Prompthero.com - этот у меня работает только с вэпээн
Pixai.art - хвалят за скорость и удобство по сравнению с Civitai
Seaart.ai - еще один неплохой конкурент
thinkdiffusion.com - генерация ИИ-арта в браузере с контролнетами
#text2image #gallery #online #tools #nsfw
Reddit
From the StableDiffusion community on Reddit: The real reason Civit is cracking down
Explore this post and more from the StableDiffusion community
👍3🔥3❤2😭2
Media is too big
VIEW IN TELEGRAM
Hunyuan3D 2.5
Новая версия 3D-генератора, 10B параметров.
Авториг, многоракурсная генерация 3D, PBR текстуры
Попробовать - можно войти по имейлу
#imageto3d #textto3d
Новая версия 3D-генератора, 10B параметров.
Авториг, многоракурсная генерация 3D, PBR текстуры
Попробовать - можно войти по имейлу
#imageto3d #textto3d
🤯1
CSM Chat to 3D
А помните такой 3D генератор CSM?
Они прикрутили работу с 3D в чате.
Люди уже встраивают в свои пайплайны
#chatto3d #textto3d #imageto3d
А помните такой 3D генератор CSM?
Они прикрутили работу с 3D в чате.
Люди уже встраивают в свои пайплайны
#chatto3d #textto3d #imageto3d
❤3🔥1
Forwarded from Santry's Singularity blog
Король умер, да здравствует король!
Протестировал новую версию китайского 3D-генератора Hunyuan 2.5.
Итак, лягушка. Первое, на что бросается в глаза — адаптивная детализация, полигонов больше там, где они действительно нужны. Сетка отлично следует за формой — это особенно заметно по сердцу и орнаменту. Впервые на моей памяти нейронка так хорошо построила рельеф. Модель получилась симметричной, без видимых артефактов вроде дыр и пересечений. Только на лапе почему-то появилась неуместная ямка.
Текстура выглядит хуже. Задняя часть представляет собой сплошной визуальный шум, и даже спереди на сердце видны артефакты.
У предыдущих поколений image-to-3D моделей ворон либо получался неровным, либо симметричным, но с раздвоенным клювом. Просто отзеркалить фигурку по вертикальной оси нельзя, однако Hunyuan 2.5 в основном справляется: укладка перьев симметричная, при этом голова выглядит вполне естественно. Впрочем, на затылке рельеф отсутствует, а на правой лапе обнаружился лишний палец. Текстуры тоже далеки от идеала и не передают особенностей оригинальной картинки.
Фигурка Ктулху также приятно удивляет детализацией и симметричностью. Сетка немного хаотичная, но органические формы переданы реалистично. Текстура покрыта шумными деталями, однако судя по бликам, roughness map удался неплохо.
Подведем итоги. Сравнение с предыдущей серией экспериментов (8 моделей, Tripo3d, TRELLIS) говорит само за себя. Прирост в качестве значительный. Лягушку и Ктулху можно спокойно печатать на 3D-принтере без постобработки. Такими темпами вскоре придется обновлять тест, добавляя сложные формы, например, скульптуры людей.
Сейчас этот генератор доступен онлайн по адресу 3d.hunyuan.tencent.com (осторожно, интерфейс на китайском) и позволяет создавать до 20 моделей в день. А еще есть надежда на релиз в open source. По крайней мере, версия 2.0 представлена в pinokio и запускается на достаточно широком наборе конфигураций железа.
#нейронки #imageto3d #DIY
Протестировал новую версию китайского 3D-генератора Hunyuan 2.5.
Итак, лягушка. Первое, на что бросается в глаза — адаптивная детализация, полигонов больше там, где они действительно нужны. Сетка отлично следует за формой — это особенно заметно по сердцу и орнаменту. Впервые на моей памяти нейронка так хорошо построила рельеф. Модель получилась симметричной, без видимых артефактов вроде дыр и пересечений. Только на лапе почему-то появилась неуместная ямка.
Текстура выглядит хуже. Задняя часть представляет собой сплошной визуальный шум, и даже спереди на сердце видны артефакты.
У предыдущих поколений image-to-3D моделей ворон либо получался неровным, либо симметричным, но с раздвоенным клювом. Просто отзеркалить фигурку по вертикальной оси нельзя, однако Hunyuan 2.5 в основном справляется: укладка перьев симметричная, при этом голова выглядит вполне естественно. Впрочем, на затылке рельеф отсутствует, а на правой лапе обнаружился лишний палец. Текстуры тоже далеки от идеала и не передают особенностей оригинальной картинки.
Фигурка Ктулху также приятно удивляет детализацией и симметричностью. Сетка немного хаотичная, но органические формы переданы реалистично. Текстура покрыта шумными деталями, однако судя по бликам, roughness map удался неплохо.
Подведем итоги. Сравнение с предыдущей серией экспериментов (8 моделей, Tripo3d, TRELLIS) говорит само за себя. Прирост в качестве значительный. Лягушку и Ктулху можно спокойно печатать на 3D-принтере без постобработки. Такими темпами вскоре придется обновлять тест, добавляя сложные формы, например, скульптуры людей.
Сейчас этот генератор доступен онлайн по адресу 3d.hunyuan.tencent.com (осторожно, интерфейс на китайском) и позволяет создавать до 20 моделей в день. А еще есть надежда на релиз в open source. По крайней мере, версия 2.0 представлена в pinokio и запускается на достаточно широком наборе конфигураций железа.
#нейронки #imageto3d #DIY
👍6❤3🤯1
Hummingbird-0
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
👍9😐2
Нейронавт | Нейросети в творчестве
Hunyuan3D 2.5 Новая версия 3D-генератора, 10B параметров. Авториг, многоракурсная генерация 3D, PBR текстуры Попробовать - можно войти по имейлу #imageto3d #textto3d
Ахаха! Белая плесень
Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота
Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота
😁7🥴1
Media is too big
VIEW IN TELEGRAM
Lyria 2
Генератор музыки от Deepmind
Все серьезно и очень продуктово.
Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек
Записаться в вейтлист
————————
Lyria RealTime
А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)
Ну что, суно/удио бояться, батя вышел на поляну.
#music #text2music #music2music
Генератор музыки от Deepmind
Все серьезно и очень продуктово.
Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек
Записаться в вейтлист
————————
Lyria RealTime
А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)
Ну что, суно/удио бояться, батя вышел на поляну.
#music #text2music #music2music
🔥6🤷♂1
MusicGPT
Еще один генератор-редактор музыки/песен/звука
Можно делать инструментал, можно с вокалом
Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста
И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!
Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь
На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе
#music #text2music #text2sound #music2music #tts #text2speech
Еще один генератор-редактор музыки/песен/звука
Можно делать инструментал, можно с вокалом
Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста
И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!
Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь
На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе
#music #text2music #text2sound #music2music #tts #text2speech
🔥10🤮1
Seurat: From Moving Points to Depth
Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели
Код ждем
Демо ждем
#trtacking #video2depth
Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели
Код ждем
Демо ждем
#trtacking #video2depth
❤3