Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
И снова Gemini.
Мне удалось зайти в обновленный Bard по инструкции Сиолошной. Есть плагин для анализа видео с YouTube. Но он упрямо не может получить доступ к большинству видео. Пятое видео согласился обработать, задумался уже минут на 5. Так что пока печально. Зато бесплатный анализ видео. Ну и в Барде сейчас не старшая модель, а старшую выкатят позже.

Теперь о хорошем. Если вы не видели вот это видео с официального канала Google, обязательно посмотрите, у меня сносит крышу
https://youtu.be/UIZAiXYceBI?si=kVlJjRIbbXxdHUde
This media is not supported in your browser
VIEW IN TELEGRAM
Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

Новый инструмент точной оценки глубины на основе SD. Круче чем все что я видел

Код
Демо
Колаб

#image2depth
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
PatchFusion: An End-to-End Tile-Based Framework for High-Resolution Monocular Metric Depth Estimation

И его конкурент. Берет грубое предсказание глубины, например от ZoeDepth. Бьет картинку на патчи и поверх грубого делает более точную оценку.

Есть желающие экспериментально выяснить кто лучший из этих двух?

Код
Демо

#image2depth
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
pose.rip

Пляшем. Magic Animate для всех.
Тут можно сделать и DensePose и анимацию.

Накидывайте результаты в комменты

#tools #image2video #video2motion #video2pose
1👍1
Поздравляю всех причастных к VFX индустрии! Сегодня наш официальный праздник!

Организаторы запланировали бесчисленное количество лекций и стримов, подробности: worldvfxday.com
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
А праздник-то настоящий.
Пришел триал-доступ к Cuebrick
Проверьте свою почту
This media is not supported in your browser
VIEW IN TELEGRAM
Aura

Deepgram, известный своим транскрибатором Nova2, представил голосовой движок реального времени Aura. Задержка всего 200мс.

В комплекте API для голосовых агентов искусственного интеллекта. Много языков, в том числе русский

Записаться в вейтлист

#text2speech
👍1🔥1
Forwarded from AI для Всех (Artemii)
S-LoRA: матрица намного ближе, чем кажется

S-LoRA превращает любую большую языковую модель в "Матрицу", где каждый Агент Смит может быть адаптирован в уникального персонажа, создавая целый мир на одной платформе.

Представьте, если бы Агент Смит из "Матрицы" мог превращаться в любого уникального персонажа по вашему желанию. Вот рецепт:

1. Базовая модель - Агент Смит: LLaMA, наша базовая модель, аналогична Агенту Смиту - мощной и адаптируемой форме ИИ, готовой к изменениям.

2. LoRA-адаптеры - Настройки персонажей: Каждый LoRA-адаптер добавляет свои уникальные характеристики к базовой модели, превращая стандартного Агента Смита в множество разнообразных персонажей.

3. S-LoRA - Матрица: S-LoRA действует как "Матрица", в рамках которой все эти преобразования происходят. Она позволяет масштабировать и управлять множеством адаптированных персонажей, поддерживая сложную сеть взаимодействующих и эволюционирующих форм.

S-LoRA открывает новые горизонты в использовании LLMs, позволяя нам не только создавать уникальные характеристики базовой модели, но и управлять ими в масштабах, сравнимых с "Матрицей".

🤩 Статья
🐙 Код
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DynamiCrafter: Animating Open-domainImages with Video Diffusion Priors

Анимация изображений по текстовому описанию, интерополяция кадров на видео, закольцовывание видео

Код
Демо

#image2video #video2video #frameinterpolation
👍1
Нейронавт | Нейросети в творчестве
А праздник-то настоящий. Пришел триал-доступ к Cuebrick Проверьте свою почту
Еще пришла месячная триалка на Unity Muse.
Только она требует для бесплатной триалки заграничную кредитку или рабочий PayPal. Палка у меня есть пустая, не прокатило.

Если вдруг кто хочет помочь своей палкой или кредиткой ради теста, пишите в лс
👍1
Forwarded from эйай ньюз
БОЛЬШИЕ НОВОСТИ - Согласован Европеский The AI Act!

TL;DR: На большие AI модели наложено очень много ограничений. Кончилась лафа для компаний, строящих LLM в EU.

Основные последствия The AI Act:

1️⃣Система рисков по уровням: Для систем AI, классифицированных как высокорисковые, были согласованы четкие обязательства и требования прозрачности. Теперь потребуется обязательная оценка потенциально негативных воздействий на здравоозранение, бузопасность, базовые права человека, и общество в целом.

2️⃣ Foundation модели будут регулироваться, если на их обучение ушло как минимум 10^25 flops вычислительной мощности - в эту категорию попадут модели как минимум уровня GPT-3.5.

3️⃣Благодаря немцам, французам и итальянцам удалось добиться значительных поблажек для Open-Source моделей. Это слегка снимает стресс с некоторых компаний которые публикуют опенсорсные модели, включая французскую компанию Mistral и немецкую Aleph Alpha, а также Meta с ее моделями LLaMA. Ян Лекун поспособствовал.

4️⃣ Следующие системы будут запрещены, и у компаний будет всего шесть месяцев, чтобы обеспечить соблюдение:
▪️системы биометрической категоризации, использующие чувствительные характеристики (например, политические, религиозные, философские убеждения, сексуальная ориентация, раса);
▪️ненаправленное скрейпинг изображений лиц из интернета или с камер видеонаблюдения для создания баз данных распознавания лиц;
▪️распознавание эмоций на рабочем месте и в образовательных учреждениях;
▪️социальное скоринг на основе социального поведения или личных характеристик;
▪️ AI, которые манипулируют человеческим поведением, чтобы обойти их свободную волю;
▪️AI, используемый для эксплуатации уязвимостей людей (из-за их возраста, инвалидности, социального или экономического положения).

5️⃣Системы AI высокого риска будут особенно тщательно проверяться на наличие байесов, предвзятости, обеспечивая их недискриминационность и уважение основных прав человека.

6️⃣Поставщики систем AI высокого риска должны вести тщательную документацию, чтобы продемонстрировать свое соответствие регуляциям. Это включает запись методов обучения и используемых наборов данных.

7️⃣ Санкции: Несоблюдение может привести к значительным штрафам, варьирующимся от 35 миллионов евро или 7% от глобального оборота до 7,5 миллиона евро или 1,5% от оборота, в зависимости от нарушения и размера компании.

Усиленные требования к прозрачности могут вызвать проблемы с защитой интеллектуальной собственности, требуя баланса между раскрытием информации и сохранением коммерческой тайны.

Все это потенциально увеличит операционные затраты и наложет значительную административную нагрузку, что потенциально может повлиять на время выхода на рынок новых AI продуктов в Европе.

А скоро, думаю, и другие страны подтянутся со своими законами. В долгосрок выиграют те, кто не так сильно закинет удавку на разработчиков AI. Как же сейчас британские компании радуются, что они не в EU.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔2👎1🔥1
Forwarded from эйай ньюз
Не хотел писать про Gemini, который на днях анонсировали как мультимодальную модель уровня GPT-4, пока сам не пощупаю. Но Google обделался в пиаре своего Gemini, что тут грех не написать.

Демо-видео Gemini оказалось смонтированным, а не отражающим реальные возможности модели в реал-тайм. Видео нарезали, ускорили и смонтировали, выбросив то, какие именно промпты и какие кадры подавались модели, чтобы получить красивые ответы для демки.

Google признал монтаж, но утверждает, что целью было вдохновить разработчиков. ПРОСТО ГЕНИИ 🤣.

Кстати, у Гугла был похожий PR-провал во время анонса Bard 👍.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3😱3
Мне иногда хочется поделиться с миром какой-нибудь невероятно важной мыслью или просто побрюзжать не по теме нейросетей. Возвращаться ради этого в проклятые роскомнадзором соцсети или, прости господи, ВК - не вариант. Посему по выходным иногда буду брюзжать здесь с тегом #оффтоп
Если вам эта идея не нравится, ставьте 👎. Не возражаете - ставьте 👍

Сходил на днях на премьеру Мальчик и Птица.
Короче так. Он самый. По нескольким пунктам.
Самый непонятный фильм Миядзаки. До самого конца продолжаешь гадать что все это означает.
В нем самые злые злодеи из всех фильмов Миядзаки.
Ну и возможно самый красивый.

Ведрикт: удовольствие получено. Закопаться в обзоры и посмотреть еще раз
👍34🔥5👎42🤔1
Incincible (Непобедимый, Неуязвимый), Второй сезон

С первого же эпизода меня огорчили мультивселенским трендом.

Переубедите меня, все что сегодня снимают про мультивселенные - лэзи райтинг. Этакий дешманский способ вырулить из любого сценарного тупика.
Хотя сама идея мультивселенной интересная и крутая, но ее опошлили. Ну ладно, есть пара исключений.

Сейчас доступно 4 эпизода, и к теме мультивселенной после первого не возвращались - это плюс. Омнимэн раскис - это минус. В остальном бодро, буду досматривать.

#оффтоп
👎5👍4
Media is too big
VIEW IN TELEGRAM
Самое лучшее применение генераторов видео, что я видел за весь год. На моменте с соком порвало

Тикток автора

#aiart
🔥15👎2👍1
Relightable Gaussian Codec Avatars

Аватары на гауссианах с релайтингом от Meta.
Позволяет фиксировать трехмерные детали размером до миллиметра, такие как пряди волос и поры на динамических изображениях лица. Дополнительно улучшают точность отражения глаз и явное управление взглядом. Отдельно работают со спекулярами. Работает в реальном времени.

Кода не дали (такая корова самим нужна)

[UPDATE]
Код

#realtime #humanavatar #head #talkinghead #relighting
🔥4👍1