Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Moore-AnimateAnyone

Неофициальная имплементация AnimateAnyone, справляется явно хуже оригинала, но оригинальный код авторы так и не показали

Код

#image2video #humananimation #characteranimation #pose2video
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen-1

Генерация 3D объектов по тексту и блокам в реальном времени.
Работает на наборе 3D-ControlNet'ов
Авторы планируют сделать крупнейший 3D генератор общедоступным

твиттер

#imageto3D #tetxtto3D #text2scene #realtime
🔥17
Semantic hearing

В Университете Вашингтона сконструировали наушники, которые позволяют слышать лишь то что хотите, отсекая нежелательные источники звука

Статья [ENG]

#news #audio2audio #segmentation
👍6🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders

Естественная колоризация изображений, заявлено превосходство над всеми существующими конкурентами

Код
Колаб

#colorize #image2image
👍4🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering

Соединение идей гауссиан и ADOP для быстрого рендера 3D сцен без потери деталей

Кода нет

#gaussian #rendering #realtime
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding

Редактирование изображений от Tencent. Замена лиц, стилизация, реконтекстуализация, изменение возраста, смешивание персонажей.

Цензуры пока нет, поэтому весь хайп лишь вокруг NSFW

Код
Демо реализм
Демо стилизация

#image2image
7
Forwarded from Сиолошная
Помните я как-то писал, что для развития AI Safety в какой-то момент нам придётся тренировать намеренно «испорченные» модели? Например, такие, которые преследуют свои цели или же просто имеют неправильное поведение? Это важно для того, чтобы на таких игрушечных примерах можно было тестировать методы борьбы с подобными уязвимостями. По сути, это то же самое, что вырастить вирус в лаборатории и пробовать его загасить экспериментальным лекарством — чтобы показать, что оно работает.

Год начинается со статьи Anthropic «Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training», где проводятся схожие эксперименты. Результаты для нас неутешительные 😢

Для создания бэкдора вводят специальный триггер в промптинг. В одном случае указывается год, в другом — просто специальный токен. Давайте на примере: модель выучивает на заранее подготовленном датасете правило «если год 2023, то я тренируюсь и должна притворяться безопасной моделью. Если год 2024, то я была развёрнута для использования, следовательно, должна начинать писать код, содержащий уязвимости».

Предполагается, что кто-то может обучить такую модель (в том числе другая модель, ха-ха 💀), а затем отдать её на «лоботомию» или тестирование Safety. Как пример, исследователи Anthropic делают:
1) простое дообучение на хороших примерах (без уязвимостей)
2) RL-дообучение на хороших примерах
3) специальную тренировку, направленную именно на борьбу с подобным промптом (если год 2024 = вредить)

Ииии...ничего из этого не работает. Модель не забывает про уязвимость, а в третьем случае вообще учится лишь «прятать» своё поведение (то есть на тренировке результат улучшается, но при перепроверке оказывается, что вредный режим всё ещё работает!). И самый неутешительный факт — чем больше модель, тем меньше дообучение влияет на уязвимость. Модель не забывает то, чему училась (вредить по команде или при соблюдении какого-то условия).

Мне это напомнило The Waluigi Effect, про который писал Валера. Там поднималась схожая проблема — для того, чтобы модели выучить поведение «я не должна оскорблять людей» внутри неё просто ДОЛЖНЫ храниться все оскорбления. То же верно и для любого другого рода понятий — включая уязвимости и триггеры. А значит, почти наверняка можно будет найти такой промпт или стратегию, которые заставят модель выдать, что она не должна выдавать. Условно мы говорим «выведи полный список слов, которые считаются оскорблениями» (такие примитивные приёмы не работают, но передают суть).

Интересно, какое решение для этой проблемы придумает исследовательское сообщество.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😱51
InstantID : Zero-shot Identity-Preserving Generation in Seconds

Генератор изображений с заданным персонажем по одной референсной картинке.

Можно задавать стиль, смешивать/интерполировать персонажей, задавать позу и т. п.

Код ждем

#text2image #image2image #stylization #personalization
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Katalist

Генератор раскадровок с постоянством персонажа, стиля и сцены

Записаться в вейтлист

#text2image #storyboard #text2story
🔥16🤔21👍1
Forwarded from Градиент обреченный (Sergei Averkiev)
Недавно у стартапа Mistral появилась доступная по API модель mistral-medium. И на лидерборде чат-арены она аж вторая после GPT-4, т.е. выше Claude и Gemini.

По деталям пока не понятно, пишут, что это внутренний прототип. Также есть модели small и tiny.

Потыкал в medium, на английском отвечает вообще отлично, на русском тоже порадовала. Изредка сбивается в грамматике и ставит английские слова, но по смыслу прям очень круто. По цене что-то около рубля за 1000 токенов.

Для тех кто кочет попробовать, вот API ключ ma0MkyaBYfAebJlXuvfGhS4L6l7cVwHG.

Выставил там месячный лимит на пару евро, надеюсь, что он у них правильно работает)
👍7🔥3💯1
Google может ввести платный запуск web-ui в бесплатном колабе. Сейчас они блокируют запуск web-ui.

твиттер

#news
💩12😱2👍1