Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Волнительное письмо пришло от Stabilty AI
Ранее они объявляли о планах создать открытую модель для генерации музыки, подобно тому как создали Stable Diffusion для изображений.

Свершилось! Проверьте почту чтобы получить приглашение в дискорд проекта Harmonai.

Если вы не подписаны на рассылку stability.ai, не переживайте, нейросеть Dance Diffusion доступна в колабе!

Возможности:
- генерация музыки/звука
- регенерация (изменение) входного аудиофайла.
- перенос стиля
- интерполяция звуков
- файнтюн (не спрашивайте что это)

Подробно как что работает еще не знаю

Гитхаб
#aimusic
🔥2
Мда, на музыку по одному клику рассчитывать не приходится. #dancediffusion генерирует звуки продолжительностью несколько секунд, качество низкое, музыкальная связность никакая на steps = 200.

С регенерацией чуть получше, но качество звука и музыкальность тоже не айс, прикрепляю примеры с регенерацией имперского марша

Впрочем, думаю, сила ее в файнтюне, а рассчет на комьюнити, которое кинется мастерить уже пригодные для использования сервисы подобно тому как ими обрастает stablediffusion
👍1
Forwarded from Share
Турецкий фотограф Альпер Ешилташ с помощью нейросети создал серию снимков «Если бы ничего не произошло»: он показал, как выглядели бы некоторые знаменитости, если бы не ушли из жизни слишком рано.

На снимках: постаревшие Майкл Джексон без пластических операций и витилиго, Хит Леджер, Курт Кобейн, Эми Уайнхаус, Принцесса Диана, Фредди Меркьюри и Тупак.
👍2
Говорят, теперь доступно всем

https://labs.openai.com/auth/signup

Но наверняка кроме россиян, поэтому запаситесь vpn и способом получить смс на иностранный номер
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
MIT Composable Diffusion: ну, за композеров.

И не только.

Это уже некая метамодель, которая разбирает текстовый ввод на части и натравливает несколько нейросеток на разные куски текста с целью определения "отношений" между объектами.

Возьмем, к примеру, красный грузовик и зеленый дом. Когда эти предложения становятся очень сложными, модель путает понятия "красный грузовик" и "зеленый дом". Типичный генератор, такой как DALL-E 2, может поменять эти цвета местами и создать зеленый грузовик и красный дом. Подход MIT может справиться с таким типом связывания атрибутов с объектами, он может обрабатывать каждый объект индивидуально.

Интересно, что создатели метят не только в область арта и смешных картинок, но и в образование, и тут можно точно начать выпивать за иллюстраторов учебников, ибо:
"Модель может эффективно определять позиции объектов и описания отношений между ними, что является сложной задачей для существующих моделей генерации изображений. Например, поместить объект и куб в определенное положение, а сферу - в другое. DALL-E 2 хорошо генерирует естественные изображения, но иногда испытывает трудности с пониманием объектных отношений. Помимо искусства и творчества, возможно, мы могли бы использовать нашу модель для обучения. Если вы хотите сказать ребенку, чтобы он положил куб на шар, и если мы скажем это словами, ему будет трудно понять. Но наша модель может сгенерировать образ и показать его".

Composable Diffusion использует диффузию наряду с композиционными операторами для объединения текстовых описаний без дополнительного обучения. Подход команды более точно передает детали текста, чем оригинальная диффузионная модель, которая напрямую кодирует слова как одно длинное предложение. Например, при наличии слов "розовое небо", "голубая гора на горизонте" и "цветущие вишни перед горой", модель команды смогла создать именно такое изображение, в то время как оригинальная диффузионная модель сделала небо голубым, а все перед горой - розовым.

В общем, впереди еще много новых открытий, возникающих на основе комбинирования уже имеющихся моделей. Нейрометамодерн.

https://scitechdaily.com/mit-ai-image-generator-system-makes-models-like-dall-e-2-more-creative/
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
MetaAI показали нейросеть MAKE-A-VIDEO, способную генерировать короткие видео-ролики по текстовому описанию!
Это новый уровень, сходите по ссылке, узрите.

Там же можно записаться в вейтлист на демо
😱3
This media is not supported in your browser
VIEW IN TELEGRAM
ИИшечка защищает газон от соседских кур. Автор видео натренил нейронку включать полив когда на газоне появляются куры. Да, реагирует только на кур. Сейчас имея вебкамеру и вы могли бы такую нейронку натренить
😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Google создал нейросеть DreamFusion text-to-3D, способную создавать 3D модели по текстовому описанию на основе Imagen!

Предположу, что ни кода, ни демо доступа для простых смертных не будет, но через полгода будет открытая нейросетка того же уровня или лучше
👍1
Смотрите какую красоту сгенерил. Нравится детализация? промт скрыт ниже

Шучу, это фото черепа Марии Магдалины, хранящегося в базилике Святого Максимина во Франции.

Извините за офтоп, искушение оказалось слишком велико.

А у вас есть фото которые выглядят как ИИ-генерации? Кидайте в чат
😱4🔥2👏1