Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Semantic hearing

В Университете Вашингтона сконструировали наушники, которые позволяют слышать лишь то что хотите, отсекая нежелательные источники звука

Статья [ENG]

#news #audio2audio #segmentation
👍6🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders

Естественная колоризация изображений, заявлено превосходство над всеми существующими конкурентами

Код
Колаб

#colorize #image2image
👍4🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering

Соединение идей гауссиан и ADOP для быстрого рендера 3D сцен без потери деталей

Кода нет

#gaussian #rendering #realtime
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding

Редактирование изображений от Tencent. Замена лиц, стилизация, реконтекстуализация, изменение возраста, смешивание персонажей.

Цензуры пока нет, поэтому весь хайп лишь вокруг NSFW

Код
Демо реализм
Демо стилизация

#image2image
7
Forwarded from Сиолошная
Помните я как-то писал, что для развития AI Safety в какой-то момент нам придётся тренировать намеренно «испорченные» модели? Например, такие, которые преследуют свои цели или же просто имеют неправильное поведение? Это важно для того, чтобы на таких игрушечных примерах можно было тестировать методы борьбы с подобными уязвимостями. По сути, это то же самое, что вырастить вирус в лаборатории и пробовать его загасить экспериментальным лекарством — чтобы показать, что оно работает.

Год начинается со статьи Anthropic «Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training», где проводятся схожие эксперименты. Результаты для нас неутешительные 😢

Для создания бэкдора вводят специальный триггер в промптинг. В одном случае указывается год, в другом — просто специальный токен. Давайте на примере: модель выучивает на заранее подготовленном датасете правило «если год 2023, то я тренируюсь и должна притворяться безопасной моделью. Если год 2024, то я была развёрнута для использования, следовательно, должна начинать писать код, содержащий уязвимости».

Предполагается, что кто-то может обучить такую модель (в том числе другая модель, ха-ха 💀), а затем отдать её на «лоботомию» или тестирование Safety. Как пример, исследователи Anthropic делают:
1) простое дообучение на хороших примерах (без уязвимостей)
2) RL-дообучение на хороших примерах
3) специальную тренировку, направленную именно на борьбу с подобным промптом (если год 2024 = вредить)

Ииии...ничего из этого не работает. Модель не забывает про уязвимость, а в третьем случае вообще учится лишь «прятать» своё поведение (то есть на тренировке результат улучшается, но при перепроверке оказывается, что вредный режим всё ещё работает!). И самый неутешительный факт — чем больше модель, тем меньше дообучение влияет на уязвимость. Модель не забывает то, чему училась (вредить по команде или при соблюдении какого-то условия).

Мне это напомнило The Waluigi Effect, про который писал Валера. Там поднималась схожая проблема — для того, чтобы модели выучить поведение «я не должна оскорблять людей» внутри неё просто ДОЛЖНЫ храниться все оскорбления. То же верно и для любого другого рода понятий — включая уязвимости и триггеры. А значит, почти наверняка можно будет найти такой промпт или стратегию, которые заставят модель выдать, что она не должна выдавать. Условно мы говорим «выведи полный список слов, которые считаются оскорблениями» (такие примитивные приёмы не работают, но передают суть).

Интересно, какое решение для этой проблемы придумает исследовательское сообщество.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😱51
InstantID : Zero-shot Identity-Preserving Generation in Seconds

Генератор изображений с заданным персонажем по одной референсной картинке.

Можно задавать стиль, смешивать/интерполировать персонажей, задавать позу и т. п.

Код ждем

#text2image #image2image #stylization #personalization
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Katalist

Генератор раскадровок с постоянством персонажа, стиля и сцены

Записаться в вейтлист

#text2image #storyboard #text2story
🔥16🤔21👍1
Forwarded from Градиент обреченный (Sergei Averkiev)
Недавно у стартапа Mistral появилась доступная по API модель mistral-medium. И на лидерборде чат-арены она аж вторая после GPT-4, т.е. выше Claude и Gemini.

По деталям пока не понятно, пишут, что это внутренний прототип. Также есть модели small и tiny.

Потыкал в medium, на английском отвечает вообще отлично, на русском тоже порадовала. Изредка сбивается в грамматике и ставит английские слова, но по смыслу прям очень круто. По цене что-то около рубля за 1000 токенов.

Для тех кто кочет попробовать, вот API ключ ma0MkyaBYfAebJlXuvfGhS4L6l7cVwHG.

Выставил там месячный лимит на пару евро, надеюсь, что он у них правильно работает)
👍7🔥3💯1
Google может ввести платный запуск web-ui в бесплатном колабе. Сейчас они блокируют запуск web-ui.

твиттер

#news
💩12😱2👍1
Forwarded from CG дневничок (Sergey Frolov)
Новый скандал на просторах VFX-пустоши.

Framestore (одна из топовых студий), несколько дней назад опубликовали новую вакансию "Generative AI Artist", кандидат должен был работать в Stable Diffusion, ComfyUI, Automatic1111, Midjourney, Dalle и Runway.

Комментарии под постом разделились: некоторые считают, что художники и искусственный интеллект должны работать вместе, чтобы максимизировать результат, но большинство считает, что это ужасная идея, отчасти из-за проблем с авторским правом, и Framestore следует просто нанять традиционного художника.

Комментарий от студии:
Вчера одно из наших объявлений о вакансиях для AI-художника вызвало некоторое беспокойство в нашем сообществе. Новый сотрудник будет работать в сотрудничестве с иллюстратором над проектом. Сначала мы закажем работу у классического художника, а потом используем различные методы VFX, включая AI, чтобы доработать изображение. Частично это будет сделано путем анимации определенных ключевых кадров, а также обучения частных моделей и расширений


Студия добавила, что использует AI для содействия творчеству людей, помогая командам художников быстрее достигать результата. Они считают, что AI может "помочь работе художников, позволяя им делать больше того, что они любят".

Вакансию удалили.

Напомню, что в июне Marvel пытались использовать AI-генерацию для титров "Секретного вторжения", что из этого вышло можно глянуть здесь. Но тогда тоже разгорелся скандал, что скайнет забирает работу у мешков с костями.

Что касается моего мнения по этой теме — да вообще похуй. Я сам использую нейросети для упрощения и ускорения работы, только динозавры могут протестовать против AI. Давайте тогда отключим ротобраш и runway, эти штуки у индусов забирают рисовые пиалки.
👏17👍1
This media is not supported in your browser
VIEW IN TELEGRAM
ZeroShape: Regression-based Zero-shot Shape Reconstruction

Реконструкция 3D объекта по одному изображению, превосходит конкурентов по скорости генерации и стоимости обучения. Реконструирует только геометрию, без текстур.

Код
Демо

#imageto3D
🔥52