Neural Shit – Telegram
Neural Shit
49.9K subscribers
3.73K photos
1.17K videos
22 files
1.91K links
Проклятые нейронные сети

Для связи: @krasniy_doshik

ркн https://clck.ru/3PNXmE
Download Telegram
Было слегка скучно, потому я игрался с новым Gemini, проверял консистентность генерируемых картинок. И случайно нагенерировал комикс к копипасте про батин жареный суп
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам позалипать на ночь. Это визуализация выходных сигналов трансформера (архитектура, на которой работают почти все современные LLM: ChatGPT, Claude, Llama и иже с ними)

А вот тут можно самим понажимать в онлайн режиме, если интересно.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Языковая 3Д-генерация.

У нас есть некоторое количество сервисов для 3Д-генерации, о которых я неоднократно писал.
Проблема там в основном в топологии (каша) и в качестве текстур. Плюс в ограниченности сцены - как правило это один объект.

Уже неделю как интернет бомбит от связки Блендора и Клода 3.7 через MCP, о которой я тоже писал.
Ну и действительно, поглядите на пример.

Все, что потребовалось здесь, это сгенерировать картинку, а потом сказать Клюду:
"Recognize any elements of this scene individually. Describe them precisely, then build them in a scene."

"Распознай все элементы этой сцены по отдельности. Опишите их точно, а затем сделай из них сцену".

"Традиционные" 3Д-генераторы тоже пытаются распознать картинку, потом сгенерить ее с разных ракурсов, а потом восстановить 3Д из нескольких картинок. А Клод пытается "собрать\отрендерить сцену" с помощью, грубо говоря, скриптов для Блендора - запуская разные команды, о которых он в курсе. Процедурное моделирование на стрероидах LLM.

Понятно, что пока довольно примитивные сцены, понятно, что замоделить голову неведомого ему персонажа будет сложновато, но дайте время.

Интересно подумать, над специальным файнтюном как для распознавания картинок, так и для (и особенно) для Блендора. Файнтьюн, который обучен на последовательностях действий и сценах.

Просто сцены, которые генерит Клод, отлично редактируются, анимируются - это нормальная геометрия, а не обмылки из 3Д-генераторов.

Интересно, посмотреть, что будет дальше.

@cgevent
да
Лол
Media is too big
VIEW IN TELEGRAM
Тут кто-то сделал графическую обертку для Gemini Flash, теперь можно рисовать наброски и допиливать их с помощью текста.

Работает так себе, но чуток развлечься норм.

Попробовать можно тут
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI запилили интересную штуку — Stable Virtual Camera. По одной или нескольким фотографиями генерирует плавное видео, имитируя движение камеры. Идеальная штука для генерации новых ракурсов сцены.


Попробовать можно в спейсе на huggingface (сейчас большой наплыв желающих, может не запуститься)
тут моделька и все подробности
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь роботы-пылесосы будут выглядеть так.

Киберпанк, который мы зслужили.
Шат ап энд тэйк май мани!!!

Реально, очень крутое зеркало, теперь мне тоже надо такое
Давно следил в твитторе за одним из самых интересных по моему мнению бенчмарков для LLM — MC-Bench. Суть: разные модельки генерируют код и с помощью него через api майнкрафта строят заданные промптом строения (а я тот еще майнкрафтолог).

Наконец-то они запустили нормальный сайт по типу арены с возможностью голосовать за результаты. Из минусов: нельзя самому писать промпты, только оценка по уже заготовленным подсказкам и уже сгенерированными по ним строениям.

Ожидаемо, на первых местах Claude 3.7 sonnet, ChatGPT 4.5 и Deepseek r1.

Посмотреть можно тут
Нашёл канал, где показывается как в диджитале, геймдеве, нейронках  и других сферах (типа архитектуры или мебели вообще) работают с конкретно русской эстетикой.

Довольно залипательно. Много прям годноты. Например, генератор фрактальных ковров или русская живопись в VR