И снова Gemini.
Мне удалось зайти в обновленный Bard по инструкции Сиолошной. Есть плагин для анализа видео с YouTube. Но он упрямо не может получить доступ к большинству видео. Пятое видео согласился обработать, задумался уже минут на 5. Так что пока печально. Зато бесплатный анализ видео. Ну и в Барде сейчас не старшая модель, а старшую выкатят позже.
Теперь о хорошем. Если вы не видели вот это видео с официального канала Google, обязательно посмотрите, у меня сносит крышу
https://youtu.be/UIZAiXYceBI?si=kVlJjRIbbXxdHUde
Мне удалось зайти в обновленный Bard по инструкции Сиолошной. Есть плагин для анализа видео с YouTube. Но он упрямо не может получить доступ к большинству видео. Пятое видео согласился обработать, задумался уже минут на 5. Так что пока печально. Зато бесплатный анализ видео. Ну и в Барде сейчас не старшая модель, а старшую выкатят позже.
Теперь о хорошем. Если вы не видели вот это видео с официального канала Google, обязательно посмотрите, у меня сносит крышу
https://youtu.be/UIZAiXYceBI?si=kVlJjRIbbXxdHUde
YouTube
The capabilities of multimodal AI | Gemini Demo
Our natively multimodal AI model Gemini is capable of reasoning across text, images, audio, video and code. Here are favorite moments with Gemini Learn more and try the model: https://deepmind.google/gemini
Explore Gemini: https://goo.gle/how-its-made…
Explore Gemini: https://goo.gle/how-its-made…
This media is not supported in your browser
VIEW IN TELEGRAM
Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation
Новый инструмент точной оценки глубины на основе SD. Круче чем все что я видел
Код
Демо
Колаб
#image2depth
Новый инструмент точной оценки глубины на основе SD. Круче чем все что я видел
Код
Демо
Колаб
#image2depth
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
PatchFusion: An End-to-End Tile-Based Framework for High-Resolution Monocular Metric Depth Estimation
И его конкурент. Берет грубое предсказание глубины, например от ZoeDepth. Бьет картинку на патчи и поверх грубого делает более точную оценку.
Есть желающие экспериментально выяснить кто лучший из этих двух?
Код
Демо
#image2depth
И его конкурент. Берет грубое предсказание глубины, например от ZoeDepth. Бьет картинку на патчи и поверх грубого делает более точную оценку.
Есть желающие экспериментально выяснить кто лучший из этих двух?
Код
Демо
#image2depth
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
pose.rip
Пляшем. Magic Animate для всех.
Тут можно сделать и DensePose и анимацию.
Накидывайте результаты в комменты
#tools #image2video #video2motion #video2pose
Пляшем. Magic Animate для всех.
Тут можно сделать и DensePose и анимацию.
Накидывайте результаты в комменты
#tools #image2video #video2motion #video2pose
❤1👍1
Поздравляю всех причастных к VFX индустрии! Сегодня наш официальный праздник!
Организаторы запланировали бесчисленное количество лекций и стримов, подробности: worldvfxday.com
Организаторы запланировали бесчисленное количество лекций и стримов, подробности: worldvfxday.com
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Aura
Deepgram, известный своим транскрибатором Nova2, представил голосовой движок реального времени Aura. Задержка всего 200мс.
В комплекте API для голосовых агентов искусственного интеллекта. Много языков, в том числе русский
Записаться в вейтлист
#text2speech
Deepgram, известный своим транскрибатором Nova2, представил голосовой движок реального времени Aura. Задержка всего 200мс.
В комплекте API для голосовых агентов искусственного интеллекта. Много языков, в том числе русский
Записаться в вейтлист
#text2speech
👍1🔥1
Forwarded from AI для Всех (Artemii)
S-LoRA: матрица намного ближе, чем кажется
S-LoRA превращает любую большую языковую модель в "Матрицу", где каждый Агент Смит может быть адаптирован в уникального персонажа, создавая целый мир на одной платформе.
Представьте, если бы Агент Смит из "Матрицы" мог превращаться в любого уникального персонажа по вашему желанию. Вот рецепт:
1. Базовая модель - Агент Смит: LLaMA, наша базовая модель, аналогична Агенту Смиту - мощной и адаптируемой форме ИИ, готовой к изменениям.
2. LoRA-адаптеры - Настройки персонажей: Каждый LoRA-адаптер добавляет свои уникальные характеристики к базовой модели, превращая стандартного Агента Смита в множество разнообразных персонажей.
3. S-LoRA - Матрица: S-LoRA действует как "Матрица", в рамках которой все эти преобразования происходят. Она позволяет масштабировать и управлять множеством адаптированных персонажей, поддерживая сложную сеть взаимодействующих и эволюционирующих форм.
S-LoRA открывает новые горизонты в использовании LLMs, позволяя нам не только создавать уникальные характеристики базовой модели, но и управлять ими в масштабах, сравнимых с "Матрицей".
🤩 Статья
🐙 Код
S-LoRA превращает любую большую языковую модель в "Матрицу", где каждый Агент Смит может быть адаптирован в уникального персонажа, создавая целый мир на одной платформе.
Представьте, если бы Агент Смит из "Матрицы" мог превращаться в любого уникального персонажа по вашему желанию. Вот рецепт:
1. Базовая модель - Агент Смит: LLaMA, наша базовая модель, аналогична Агенту Смиту - мощной и адаптируемой форме ИИ, готовой к изменениям.
2. LoRA-адаптеры - Настройки персонажей: Каждый LoRA-адаптер добавляет свои уникальные характеристики к базовой модели, превращая стандартного Агента Смита в множество разнообразных персонажей.
3. S-LoRA - Матрица: S-LoRA действует как "Матрица", в рамках которой все эти преобразования происходят. Она позволяет масштабировать и управлять множеством адаптированных персонажей, поддерживая сложную сеть взаимодействующих и эволюционирующих форм.
S-LoRA открывает новые горизонты в использовании LLMs, позволяя нам не только создавать уникальные характеристики базовой модели, но и управлять ими в масштабах, сравнимых с "Матрицей".
🤩 Статья
🐙 Код
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VMC: Video Motion Customization using Temporal Attention Adaption for Text-to-Video Diffusion Models
Генерация видео с движением, заданным образцом из другого видео
Код
#video2video #motion2video #text2video
Генерация видео с движением, заданным образцом из другого видео
Код
#video2video #motion2video #text2video
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DynamiCrafter: Animating Open-domainImages with Video Diffusion Priors
Анимация изображений по текстовому описанию, интерополяция кадров на видео, закольцовывание видео
Код
Демо
#image2video #video2video #frameinterpolation
Анимация изображений по текстовому описанию, интерополяция кадров на видео, закольцовывание видео
Код
Демо
#image2video #video2video #frameinterpolation
👍1
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting
Генерация 3D-человеков гауссианами по текстовому описанию. А заодно еще и анимация. По сравнениям лучше чем DreamGaussian
Код
#textto3D #text2gaussian #humanavatar #humananimation
Генерация 3D-человеков гауссианами по текстовому описанию. А заодно еще и анимация. По сравнениям лучше чем DreamGaussian
Код
#textto3D #text2gaussian #humanavatar #humananimation
🔥3
Нейронавт | Нейросети в творчестве
А праздник-то настоящий. Пришел триал-доступ к Cuebrick Проверьте свою почту
Еще пришла месячная триалка на Unity Muse.
Только она требует для бесплатной триалки заграничную кредитку или рабочий PayPal. Палка у меня есть пустая, не прокатило.
Если вдруг кто хочет помочь своей палкой или кредиткой ради теста, пишите в лс
Только она требует для бесплатной триалки заграничную кредитку или рабочий PayPal. Палка у меня есть пустая, не прокатило.
Если вдруг кто хочет помочь своей палкой или кредиткой ради теста, пишите в лс
👍1
Forwarded from эйай ньюз
БОЛЬШИЕ НОВОСТИ - Согласован Европеский The AI Act!
TL;DR: На большие AI модели наложено очень много ограничений. Кончилась лафа для компаний, строящих LLM в EU.
Основные последствия The AI Act:
1️⃣ Система рисков по уровням: Для систем AI, классифицированных как высокорисковые, были согласованы четкие обязательства и требования прозрачности. Теперь потребуется обязательная оценка потенциально негативных воздействий на здравоозранение, бузопасность, базовые права человека, и общество в целом.
2️⃣ Foundation модели будут регулироваться, если на их обучение ушло как минимум 10^25 flops вычислительной мощности - в эту категорию попадут модели как минимум уровня GPT-3.5.
3️⃣ Благодаря немцам, французам и итальянцам удалось добиться значительных поблажек для Open-Source моделей. Это слегка снимает стресс с некоторых компаний которые публикуют опенсорсные модели, включая французскую компанию Mistral и немецкую Aleph Alpha, а также Meta с ее моделями LLaMA. Ян Лекун поспособствовал.
4️⃣ Следующие системы будут запрещены, и у компаний будет всего шесть месяцев, чтобы обеспечить соблюдение:
▪️системы биометрической категоризации, использующие чувствительные характеристики (например, политические, религиозные, философские убеждения, сексуальная ориентация, раса);
▪️ненаправленное скрейпинг изображений лиц из интернета или с камер видеонаблюдения для создания баз данных распознавания лиц;
▪️распознавание эмоций на рабочем месте и в образовательных учреждениях;
▪️социальное скоринг на основе социального поведения или личных характеристик;
▪️ AI, которые манипулируют человеческим поведением, чтобы обойти их свободную волю;
▪️AI, используемый для эксплуатации уязвимостей людей (из-за их возраста, инвалидности, социального или экономического положения).
5️⃣ Системы AI высокого риска будут особенно тщательно проверяться на наличие байесов, предвзятости, обеспечивая их недискриминационность и уважение основных прав человека.
6️⃣ Поставщики систем AI высокого риска должны вести тщательную документацию, чтобы продемонстрировать свое соответствие регуляциям. Это включает запись методов обучения и используемых наборов данных.
7️⃣ Санкции: Несоблюдение может привести к значительным штрафам, варьирующимся от 35 миллионов евро или 7% от глобального оборота до 7,5 миллиона евро или 1,5% от оборота, в зависимости от нарушения и размера компании.
Усиленные требования к прозрачности могут вызвать проблемы с защитой интеллектуальной собственности, требуя баланса между раскрытием информации и сохранением коммерческой тайны.
Все это потенциально увеличит операционные затраты и наложет значительную административную нагрузку, что потенциально может повлиять на время выхода на рынок новых AI продуктов в Европе.
А скоро, думаю, и другие страны подтянутся со своими законами. В долгосрок выиграют те, кто не так сильно закинет удавку на разработчиков AI. Как же сейчас британские компании радуются, что они не в EU.
@ai_newz
TL;DR: На большие AI модели наложено очень много ограничений. Кончилась лафа для компаний, строящих LLM в EU.
Основные последствия The AI Act:
▪️системы биометрической категоризации, использующие чувствительные характеристики (например, политические, религиозные, философские убеждения, сексуальная ориентация, раса);
▪️ненаправленное скрейпинг изображений лиц из интернета или с камер видеонаблюдения для создания баз данных распознавания лиц;
▪️распознавание эмоций на рабочем месте и в образовательных учреждениях;
▪️социальное скоринг на основе социального поведения или личных характеристик;
▪️ AI, которые манипулируют человеческим поведением, чтобы обойти их свободную волю;
▪️AI, используемый для эксплуатации уязвимостей людей (из-за их возраста, инвалидности, социального или экономического положения).
Усиленные требования к прозрачности могут вызвать проблемы с защитой интеллектуальной собственности, требуя баланса между раскрытием информации и сохранением коммерческой тайны.
Все это потенциально увеличит операционные затраты и наложет значительную административную нагрузку, что потенциально может повлиять на время выхода на рынок новых AI продуктов в Европе.
А скоро, думаю, и другие страны подтянутся со своими законами. В долгосрок выиграют те, кто не так сильно закинет удавку на разработчиков AI. Как же сейчас британские компании радуются, что они не в EU.
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
TechCrunch
EU lawmakers bag late night deal on ‘global first’ AI rules
After marathon 'final' talks which stretched to almost three days European Union lawmakers have tonight clinched a political deal on a risk-based After marathon 'final' talks which stretched to almost three days European Union lawmakers have tonight clinched…
👍2🤔2👎1🔥1
Forwarded from эйай ньюз
Не хотел писать про Gemini, который на днях анонсировали как мультимодальную модель уровня GPT-4, пока сам не пощупаю. Но Google обделался в пиаре своего Gemini, что тут грех не написать.
Демо-видео Gemini оказалось смонтированным, а не отражающим реальные возможности модели в реал-тайм. Видео нарезали, ускорили и смонтировали, выбросив то, какие именно промпты и какие кадры подавались модели, чтобы получить красивые ответы для демки.
Google признал монтаж, но утверждает, что целью было вдохновить разработчиков. ПРОСТО ГЕНИИ🤣 .
Кстати, у Гугла был похожий PR-провал во время анонса Bard👍 .
@ai_newz
Демо-видео Gemini оказалось смонтированным, а не отражающим реальные возможности модели в реал-тайм. Видео нарезали, ускорили и смонтировали, выбросив то, какие именно промпты и какие кадры подавались модели, чтобы получить красивые ответы для демки.
Google признал монтаж, но утверждает, что целью было вдохновить разработчиков. ПРОСТО ГЕНИИ
Кстати, у Гугла был похожий PR-провал во время анонса Bard
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3😱3
Мне иногда хочется поделиться с миром какой-нибудь невероятно важной мыслью или просто побрюзжать не по теме нейросетей. Возвращаться ради этого в проклятые роскомнадзором соцсети или, прости господи, ВК - не вариант. Посему по выходным иногда буду брюзжать здесь с тегом #оффтоп
Если вам эта идея не нравится, ставьте 👎. Не возражаете - ставьте 👍
Сходил на днях на премьеру Мальчик и Птица.
Короче так. Он самый. По нескольким пунктам.
Самый непонятный фильм Миядзаки. До самого конца продолжаешь гадать что все это означает.
В нем самые злые злодеи из всех фильмов Миядзаки.
Ну и возможно самый красивый.
Ведрикт: удовольствие получено. Закопаться в обзоры и посмотреть еще раз
Если вам эта идея не нравится, ставьте 👎. Не возражаете - ставьте 👍
Сходил на днях на премьеру Мальчик и Птица.
Короче так. Он самый. По нескольким пунктам.
Самый непонятный фильм Миядзаки. До самого конца продолжаешь гадать что все это означает.
В нем самые злые злодеи из всех фильмов Миядзаки.
Ну и возможно самый красивый.
Ведрикт: удовольствие получено. Закопаться в обзоры и посмотреть еще раз
👍34🔥5👎4❤2🤔1
Incincible (Непобедимый, Неуязвимый), Второй сезон
С первого же эпизода меня огорчили мультивселенским трендом.
Переубедите меня, все что сегодня снимают про мультивселенные - лэзи райтинг. Этакий дешманский способ вырулить из любого сценарного тупика.
Хотя сама идея мультивселенной интересная и крутая, но ее опошлили. Ну ладно, есть пара исключений.
Сейчас доступно 4 эпизода, и к теме мультивселенной после первого не возвращались - это плюс. Омнимэн раскис - это минус. В остальном бодро, буду досматривать.
#оффтоп
С первого же эпизода меня огорчили мультивселенским трендом.
Переубедите меня, все что сегодня снимают про мультивселенные - лэзи райтинг. Этакий дешманский способ вырулить из любого сценарного тупика.
Хотя сама идея мультивселенной интересная и крутая, но ее опошлили. Ну ладно, есть пара исключений.
Сейчас доступно 4 эпизода, и к теме мультивселенной после первого не возвращались - это плюс. Омнимэн раскис - это минус. В остальном бодро, буду досматривать.
#оффтоп
👎5👍4
Media is too big
VIEW IN TELEGRAM
Самое лучшее применение генераторов видео, что я видел за весь год. На моменте с соком порвало
Тикток автора
#aiart
Тикток автора
#aiart
🔥15👎2👍1
Relightable Gaussian Codec Avatars
Аватары на гауссианах с релайтингом от Meta.
Позволяет фиксировать трехмерные детали размером до миллиметра, такие как пряди волос и поры на динамических изображениях лица. Дополнительно улучшают точность отражения глаз и явное управление взглядом. Отдельно работают со спекулярами. Работает в реальном времени.
Кода не дали (такая корова самим нужна)
[UPDATE]
Код
#realtime #humanavatar #head #talkinghead #relighting
Аватары на гауссианах с релайтингом от Meta.
Позволяет фиксировать трехмерные детали размером до миллиметра, такие как пряди волос и поры на динамических изображениях лица. Дополнительно улучшают точность отражения глаз и явное управление взглядом. Отдельно работают со спекулярами. Работает в реальном времени.
Кода не дали (такая корова самим нужна)
[UPDATE]
Код
#realtime #humanavatar #head #talkinghead #relighting
🔥4👍1