Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.16K photos
912 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Forwarded from Блог о Data Science 💻 (Tagir [БОЛЕЮ])
This media is not supported in your browser
VIEW IN TELEGRAM
🔄Обучаем нейросеть проходить змейку в терминале

Вы когда-нибудь хотели обучить модель проходить змейку? Я — нет, а вот некий Bones-ai в двух проектах показал, как это работает. С помощью генетического алгоритма модель достигает идеальных результатов в змейке, а видео к посту — наглядная визуализация процесса обучения 🪩

В архитектуре нейросети используется 24 инпута. Эти инпуты предоставляют информацию о состоянии окружающей среды и самой змейки, что позволяет модели принимать решения о следующем движении📀

Обучение модели занимает около 30 минут и осуществляется через генетический алгоритм, который эволюционирует популяцию из 1000 агентов, каждый из которых представляет уникальную конфигурацию весов нейросети:

🔗Инициализация популяции: Начальная популяция агентов создаётся с случайными весами.

🔗Оценка производительности: Каждый агент оценивается по его способности собирать пищу и избегать столкновений.

🔗Отбор: Лучшие агенты выбираются для размножения на основе их "приспособленности" — чем дольше агент выживает и чем больше собирает пищи, тем выше его шансы быть выбранным для следующего поколения.

🔗Кроссовер и мутации: Веса выбранных агентов комбинируются и мутируют с небольшой вероятностью (0.1), создавая новое поколение агентов, которое потенциально наследует успешные стратегии своих предшественников.

Если хотите подробнее ознакомиться с проектом, то здесь можно найти его первую версию, здесь — вторую, а вот тут находится тред на Reddit, где автор отвечает на вопросы🖼️

Рассказывайте в комментариях, что вы думаете о таких проектах? Как вы думаете, для чего автору это нужно?🎬
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥93
This media is not supported in your browser
VIEW IN TELEGRAM
ElevenLabs выпустили нейросеть Voice Isolator, которая может удалить все посторонние звуки и шумы с вашего аудио, создавая эффект студийной записи.

Ну и главное – сервис доступен бесплатно, так что пользуйтесь. Ссылка

r/#singularity
🔥51👍7😁3
This media is not supported in your browser
VIEW IN TELEGRAM
Работа британского художника Тима Льюиса, который создаёт уникальные кинетические скульптуры.

Теперь хочется себе этого кота
r/#BeAmazed
50👍6🔥4
Ну все, художников теперь заменят еще и аниматронные коты.
😁37😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла 4o у нас дома, стриминг аудио в обе стороны, перебивает и только английский.

Играться тут

Анонс

La République est maniaque, опять ребята из Франции
😁20👍1
Теперь тоже буду так письма подписывать.
😁69🤣11🔥2
Forwarded from eternal singularity
😁66😢4👍1👀1
🤣90🔥16😁12🤩3
Forwarded from эйай ньюз
Нас ждет абсолютно новый геймдев. Зацените, что делают ребята, которые сидят на жестких гауссиан сплатах.

Одна картинка и целый мир готов. В целом генерация таких 3D сцен — это не новость, но вот в риалтайме еще никому не удавалось. На генерацию одной полной сцены уходит 10 секунд на A6000 GPU. Это, конечно, не ультра скорость, но учтите, что даже в играх никто не рендерит во все 360.  Можно считать, что это просто мир прогружается, а потом спокойно бегать.

Картинка номер 2 в общем-то вполне наглядно объясняет принцип работы. Здесь у нас солянка из добротных быстрых гауссиан сплатов, карт глубины и аутпейнтинга.

Берут изначальную картинку, из нее извлекают карту глубины, как в обычном контролнете при аутпейнтинге генерируют мир вокруг изначальной картинки. Но с тем отличием, что карту глубины как бы упрощают и берут ограниченное количество "глубин" в целях оптимизации. Тренируют салаты по картинке.

Наслаждаемся и ходим по новоиспеченной сцене.

А если к этому еще и прикрутить PhysDreamer ой-ой-йой... (это который позволяет физически взаимодействовать со сплатами)

Когда там уже нейрорендер станет мейнстримом? Где мой риалтайм сгенерированный мир в 120 fps или ещё лучше как в нашей статье 1000fps?

Ветка про Gaussian Splatting:
- 3D Gaussian Splatting ликбез
- NerfStudio, ну а вдруг пригодится,
- мерджим картинки,
- Infinite Realities
- PhysDreamer


Project page, там даже есть демо, правда, заранее сгенерированное, просто погулять. Но сам рендеринг сцены прямо в браузере, придется немного подождать.
Бумага
Код (скоро)

@ai_newz
👍28🔥123🤣2
Dankest Memes // Данкест Мемс
Video
На этом видео PoV Джо Байдена, когда он покидает сцену.
😁60🎉3😢2
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
На случай, если вы вдруг искали возможность сделать липсинг для видео или фото (для сгенерированных тоже подойдет).

Можете попробовать этот тутор для ComfuUI через LivePortait.

Линки, где качать и как устанавливать, есть в описании к видосу.

Тут
😁31🔥126👍6
Forwarded from Sickipedia
In the age of AI, dating a model is not a brag anymore

#wordplay
@Sickipedia
😁24💯4😎2
This media is not supported in your browser
VIEW IN TELEGRAM
WestWorld intensifies, kurwa!

Ну что, зловещая долина, посоны? Анатомически корректные аниматронные руки от поляков из clonerobotics

by CloneRobotics
20👍7🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
gpu.cpp - a lightweight library that makes portable GPU compute with C++ simple

Тем временем парни из answer.ai (ex fast.ai) упоролись и выкатили gpu-agnostic фреймворк на WebGPU для С++.
Теперь один и тот же код можно крутить на всем, где есть Vulkan, Metal, или DirectX.
При этом тащить 100500гб CUDA для hello world больше не надо.
/ Ну и маководы снова в деле! :D

git
x-уит
answer.ai

@derplearning
🔥38🤩1
Forwarded from эйай ньюз
MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

Юзать LLM хотят все, но инференс в облаке стоит конских денег. Но есть простое решение - давайте юзеры будут запускать LLM у себя, а не в облаке. Однако не стоит забывать – большинство пользователей интернета владеют лишь телефоном. Оперативной памяти там не так уж и много - у iPhone это 6 гигов, у большинства андроид флагманов до 12, так что нужно оптимизировать параметры, но и не забывать про перформанс. Авторам пейпера удалось заметно улучшить качество инференса на телефонах, без потерь в перформансе.

Как это вышло?

Авторы выяснили, что масштабирование модели вглубь при таком же количестве параметров работает лучше чем при масштабировании модели вширь. Таким образом модель на 125 миллионов параметров имеет 30 слоёв (у GPT-2, Bert и вообще всего в такой весовой категории обычно 12).
Традиционный для "эффективных" моделей шеринг входного и выходного слоя эмбеддингов.
Завезли Group Query Attention, который раньше в таких моделях не использовался.
Убедились что все слои влезают в кэш телефонов, потому что оперативка значительно медленнее.

Самая интересная часть - layer sharing, так что её разберём поподробнее. Идея в том, чтобы использовать один и тот же слой несколько раз, и таким образом улучшить перформанс. Попробовали несколько стратегий:

Повторять слои незамедлительно - то есть слой компьютит что-то, а потом его вывод кормится в него же.
Повторять все слои в том же порядке - по сути моделька запускается два раза на одном и том же инпуте.
Сначала считать слои в обычном порядке, а потом задом наперёд.

Лучше всех показал себя второй способ, но выбрали первый, потому что он заметно быстрее работает (не нужно грузить слой в кэш несколько раз).

В итоге вышло хорошо так улучшить результаты, без раздутия количества параметров или времени выполнения модели. Итоговая модель выдаёт более чем 50 токенов в секунду на обычном телефоне. Статья февральская, но код выложили только сейчас. Весов нет.

Пейпер
Код

@ai_newz
👍132🔥1👨‍💻1
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Всегда работающий приём — взять что-то очень новое и смешать со старым, или лучше с очень старым.

Например, взять модную шмотку, крашеные волосы, пирсинг, татухи и смешать с чтением книг, экспертностью в вине и слушаньем музыки на виниле или, ладно, кассетах.

Или делать поиски в латентном пространстве с помощью MIDI-контроллера в реальном времени.

Технологии будут совсем неотличимы от магии, если замешать всё это на химические элементы, колбы и пипетки, я полагаю.

Красота крутится на SDXL Turbo и тулките для интерактивных выставок Lunar Tools
🔥293