Neural Shit – Telegram
Neural Shit
50K subscribers
3.73K photos
1.18K videos
22 files
1.92K links
Проклятые нейронные сети

Для связи: @krasniy_doshik

ркн https://clck.ru/3PNXmE
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Несколько раз уже попадался этот видос с запиливанием статуи роботом на реддите. Сейчас он же попался в твитторе. И результат всегда один: лютый срач в комментах: искуусство это или все же нет.

Я не художник и от прекрасного далек как Тобольск от Копенгагена, но все же думаю, что вот так мощно поджигать сраки людям — это определенно искусство.
Media is too big
VIEW IN TELEGRAM
Недавно Егор запилил у себя в канале вот эту паподию на рекламу Порше, но под местные реалии. Получилось очень реалистично. Veo2 мощь!

Он же сейчас выложил не менее эпичный видос-продолжение с "бекстейджем со съемок". Кажется, получилось еще реалистичнее. Рекомендую ознакомиться тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Те, кто часто юзает нейронки для креативных задач, наверняка замечали, что при одном и том же промпте результаты генерации довольно однотипные, даже если сильно менять параметры. Да, какие-то вариации есть, но ничего кардинально нового — если попросить сделать, например, "креативные часы", то, скорее всего, получишь стандартный циферблат, но с разными цветами.

Это происходит из-за того, что LLM'ки склонны выдавать усредненные решения. Они как бы угадывают "самый вероятный" ответ, а не пробуют что-то реально нестандартное. Наткнулся на алгоритм, который призван решать вот эту проблему однообразия — Lluminate. Он позволяет при одном и том же промпте получать более разнообразные и неожиданные результаты.

Работает это через умный промптинг + анализ новизны с помощью CLIP. Вместо того чтобы просто выдать один раз генерацию, алгоритм:

1)Запускает кучу вариантов, чтобы посмотреть, насколько они реально разные.
2)CLIP оценивает их отличие в семантическом пространстве (если вариации слишком похожи, они отсеиваются).
3)Берутся самые необычные и на их основе генерятся новые поколения, каждый раз с усложнением и добавлением неочевидных штук.
4)Через несколько итераций результат уже в разы интереснее, в сравнении с тем, что было бы если б нейронку задрачивали одним и тем же запросом (даже если его слегка изменять).

Так можно не просто крутить рандом, а эволюционировать генерацию, пока результат реально не начнет удивлять. Уже тестили на шейдерах, архитектуре и генерации часов — вместо "неоновых спиралек" и "футуристических башен" в конце получаются реально уникальные и неожиданные штуки, которые LLM сам бы не придумал. Вот тут можно посмотреть насколько улучшается разнообразие (лучше смотреть с компа, с телефона сайт как-то всрато выглядит). Ну и там же подробнее расписано про этот алгоритм.

Исходники тут
Вот эта новая фича от гуглогемини, которая может генерить и изменять картинки без вызова отдельной модели позволяет делать классные последовательные гифки за несколько минут

Покрал отсюда
CEO Поиска Яндекса Дима Масюк расписал в LinkedIn принципы, на которых компания строит развитие сервисов с искусственным интеллектом. Они просты и понятны: бесшовно вписывать ИИ-решения в повседневную жизнь, строить эмоциональную связь между людьми и технологиями (привет, Алиса!) и максимально персонализировать решения для конкретного человека.

Кажется, такая стратегия у Яндекса уже пару лет точно — помню, как запускали Шедеврум, делая ставку на интуитивную простоту и удобство. Но первый раз вижу, что Дима говорит об этом публично. Видимо, это работает, учитывая популярность колонок с Алисой, да и в целом других продуктов Яндекса
Forwarded from Derp Learning
Китайцы упоролись и запилили "ноут" с десктопной 5090 😂
Палиндромы, которые мы заслужили.

отсюда
This media is not supported in your browser
VIEW IN TELEGRAM
С каждым днем мы все дальше от бога
This media is not supported in your browser
VIEW IN TELEGRAM
Путешествие по культовым картинам. Оч круто!

Подумал, что если бы вот это же кто-то запилил в VR, чтобы можно было походить-побродить внутри картин самому, было б вообще огонь, точно купил бы такое приложение, да и вообще появился бы повод достать VR-шлем с полки, а то я его уже 3 или 4 месяца даже в руки не брал

видео отсюда
AGI уже здесь
Forwarded from Denis Sexy IT 🤖
Китайский Deepseek постепенно становится их главной АИ лабой – настолько важной, что ключевых исследователей попросили сдать паспорта, чтобы те случайно не соблазнились сумасшедшими зарплатами в США ☕️

Китайские пользователи реддита не удивлены, так как Deepseek теперь работает с большим кол-вом секторов внутри Китая, включая оборонный
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем народ распробовал фишку с созданием простеньких аннимаций с помощью нового гемини. Вот, чувак автоматизировал все это дело прикрутив сверху еще и Midjourney + сделав простенький интерфейс для всего этого.

Разработчик обещает скоро выкатить эту штуку в ранний доступ
А еще новый Gemini flash 2.0 experimental очень хорошо удаляет вотермарки с изображений. Только иногда включает святошу и начинает ныть, что это противоречит его морали (просто перегенерируйте сообщение).

Ну и да, надо просить удалить не вотермарки, а именно текст, иначе лезет в залупу и не делает.
Было слегка скучно, потому я игрался с новым Gemini, проверял консистентность генерируемых картинок. И случайно нагенерировал комикс к копипасте про батин жареный суп
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам позалипать на ночь. Это визуализация выходных сигналов трансформера (архитектура, на которой работают почти все современные LLM: ChatGPT, Claude, Llama и иже с ними)

А вот тут можно самим понажимать в онлайн режиме, если интересно.