Machinelearning – Telegram
382K subscribers
4.43K photos
851 videos
17 files
4.87K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🦾 Google выпустили модель с новой архитектурой Griffin, которая превосходит transformers по своим характеристикам.

Griffin превосходит базовые показатели transformers baseline в контролируемых тестах как по шкале MMLU для различных размеров параметров, так и по среднему баллу в различных тестах.

Архитектура модели имеет преимущества в плане эффективности за счет более быстрого вывода и меньшего потребления памяти при выводе длинных контекстов.

Статья: arxiv.org/abs/2402.19427
Версия 2B на hugging face: huggingface.co/google/recurrentgemma-2b

@ai_machinelearning_big_data
🔥18👍95🍌1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Morphic

Это поисковая система с интерфейсом, генерирующая ответы на базе ИИ.

Morphic не только отвечает на вопросы, но и генерирует изображения

Проект полностью с открытым кодом и уже находится на 4-м месте в таблице лидеров новичков на Git.

Github: github.com/miurla/morphic
Попробовать: morphic.sh

@ai_machinelearning_big_data
👍20🔥95🍌1
🔥 Мощная модель LLM для локального использования — Qwen 72B

LLM-модель от Alibaba недавно обновилась до версии 72B после обучения на ошеломляющих 3 триллионах токенов многоязычных данных.
Это чудо искусственного интеллекта может быть запущено локально, что обеспечивает полный контроль и конфиденциальность (и скорость при наличии мощной GPU)

На изображении видно сравнение характеристик Qwen 72B с Llama 70B, с GPT-3.5 и GPT-4

📎 Перевод инструкции по установке
🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥75🍌1
🌟 SALMONN — ML-модель для работы с аудио

SALMONN — это новая мультимодальная модель машинного обучения с открытым исходным кодом, предназначенная для обработки аудиоданных любого типа: речи, музыки и различных звуков.

В основе SALMONN лежит интеграция большой языковой модели (LLM) с двумя энкодерами: Whisper для восприятия речи и BEATs для остальных звуков. Между собой аудиоэнкодеры и LLM объединяются через модуль преобразования данных Q-Former.
Благодаря такому сочетанию SALMONN может выполнять широкий спектр задач интеллектуальной обработки аудио, начиная с распознавания речи и заканчивая генерацией историй на основе услышанных звуков. Достаточно дать ей на вход аудиофрагмент и текстовое описание задачи.

В качестве LLM у SALMONN используется модель Vicuna, созданная на основе модели LLaMA с 13 миллиардами параметров и обученная на лучших диалогах с ChatGPT. Также авторы SALMONN выпустили версию своей модели на основе Vicuna с 7 миллиардами параметров. Первая требует для запуска видеокарту с 80 Гб памяти, а вторая — «всего» с 40 гигабайтами.

За счёт квантования модель можно ужать до 24 Гб, тогда получится запустить её на игровой видеокарте, а не только на профессиональном ускорителе.

🖥 GitHub
📕 Paper
🔥 Datasets

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥7👏4🥰2🍌2
🔥 Большой список open-source AI-моделей и не только

Полный список репозиториев ИИ с открытым исходным кодом размещен на сайте llama-police; список обновляется каждые 6 часов.

Большинство из них вы также можете найти в этом списке cool-llm-repos на GitHub.
Enjoy)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍106🍌1
⚡️ Udio AI для создания музыки с $10M инвестиций и поддержкой знаменитостей

Всего через несколько недель после того, как завирусился музыкальный генератор на базе ИИ Suno, на сцену выходит новый конкурент - Udio. Созданный бывшими сотрудниками исследовательского подразделения Google DeepMind и поддерживаемый такими тяжеловесами технологической и музыкальной индустрии, как a16z (Andreessen Horowitz), соучредитель Instagram Майк Кригер, рэперы Common и Will.i.am, продюсер Tay Keith и платформа United Masters, Udio был анонсирован 10 апреля и обещает революционизировать процесс создания музыки.

Сервис обещает преобразить процесс создания музыки, сделав его "максимально простым". Сейчас он находится на стадии публичной беты, поэтому всем зарегистрировавшимся Udio доступен бесплатно с возможностью создавать до 1200 треков в месяц. Инструмент способен генерировать отполированный трек всего за 40 секунд. По сути, сравнимо с Midjourney: просто вводишь промпт и получаешь трек. Также достаточно указать желаемый музыкальный жанр или артистов, предоставить тему или персонализированный текст песни. После создания трека в приложении можно воспользоваться функцией "ремикс", которая позволяет дорабатывать треки с помощью текстовых описаний. Он даже умеет генерировать в стерео-формате, где левый и правый каналы реально отличаются.

Пользуйтесь)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥94🍌4
🔥 Wunjo AI — open-source проект позволяющий создавать дипфейки и не только

Помимо создания дипфейков этот проект с открытым исходным кодом может клонировать речь, генерировать видео, удалять текст и объекты, а также получать изображения без фона, прямо на вашем компьютере.
Wunjo AI — это локальное приложение, которое работает даже на слабых компьютерах, предоставляя вам возможности по созданию контента любой длительности.

📎 Описание Wunjo AI от автора
📎 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍12🔥9😁2🍌2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Text Generation Inference v2.0.0  —   готовый сервер для инференса LLM, написанный на Rust, Python и gRPC.

Инференс ML-модели - это процесс её работы на конечном устройстве. Поэтому, чем больше мы разгоняем инференс, тем быстрее работает модель.

В новую версию Text Generation Inference добавлена поддержка модели Command R+.

TGI - самый быстрый сервер с открытым исходным кодом для Command R+

Используя возможности Medusa heads, на тестах достигается беспрецедентная скорость с задержкой всего в 9 мс на токен для модели 104B!

ПОддерживает популярные Lms с открытым исходным кодомД Llama, Falcon, StarCoder, BLOOM, GPT-NeoX и другие.

Github
Установка

@ai_machinelearning_big_data
👍62🔥85🍌1
🔥 Создание 3D-моделей из плоской картинки с помощью DUSt3R

Встречайте DUSt3R — новый подход геометрического конструирования 3D на основе 2D (Dense and Unconstrained Stereo 3D Reconstruction).
DUSt3R не требует калибровки камеры или данных о точке обзора.

Ключевые возможности DUSt3R:
🟡Работает с произвольными коллекциями изображений

🟡Интеграция монокулярных и бинокулярных методов реконструкции с помощью регрессии точечных карт

🟡Выравнивает многоракурсные карты точек в общую систему координат

🟡Использует кодеры/декодеры с предварительно обученными моделями

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥123👏3
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ В Google Workspace появился ИИ-видеоредактор

В Google Workspace (который содержит приложения типа Docs, Sheets и Slides) появился новый сервис — онлайн видеоредактор Vids.

Это довольно простое приложение для создания видео, предназначенное для бизнеса.
Вы можете использовать его для создания видеопрезентаций с временной шкалой, в которые можно быстро накидать картинки со своего Google Диска.

Вы также можете добавить закадровый голос или видеозапись своей речи, чтобы добавить привлекательности.

Однако что делает Vids действительно интересным, так это то, что он использует ИИ Gemini.

Пользователи могут попросить Gemini писать сценарии, создавать раскадровки и даже озвучивать видео.

Он также может использовать библиотеку видеоматериалов и даже самостоятельно создавать изображения.
Vids в настоящее время тестируется небольшим количеством пользователей Workspace.

📎 Introducing Google Vids

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥107❤‍🔥2🤬1
📓Free book: "Build an LLM from Scratch"

Один из лучших способов разобраться в LLM - это написать ее с нуля!

Сегодня вышла новая глава книги - "Chapter 5: Pretraining on Unlabeled Data".

Автор книги - Себастьян Рашка, известный Исследователь, популяризатор машинного обучения и автор книг по Deep Learning.

В этой главе рассматриваются:
- Оценка качества текста, сгенерированного LLM во время обучения
- Реализация функции обучения и настройка LLM
- Сохранение и загрузка весов для обучения LLM
- Загрузка предварительно подготовленных весов из OpenAI

Github

@ai_machinelearning_big_data
👍34🔥156
HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach

Новая модель для переноса прически с эталонного изображения на исходную фотографию для виртуальной примерочной.

Paper: https://arxiv.org/abs/2404.01094
Code: https://github.com/AIRI-Institute/HairFastGAN
Colab: https://colab.research.google.com/#fileId=https%3A//huggingface.co/AIRI-Institute/HairFastGAN/blob/main/notebooks/HairFast_inference.ipynb

@ai_machinelearning_big_data
👍30🔥72🤷‍♀1
🖥 GitHub Copilot в CLI теперь общедоступен (вышел из беты)

Относительно недавно GitHub Copilot объявил об общедоступности своего расширения интерфейса командной строки (CLI). Это обновление расширяет функциональность Copilot на терминал, позволяя пользователям получать выгоду от его функций непосредственно в рабочем процессе.

Новые функции Copilot CLI:
Теперь Copilot может предлагать команды на основе пользовательского ввода, а также выполнять эти команды

Помимо предложений на основе пользовательского ввода, Copilot будет предоставлять пояснения к существующим командам

Новые вспомогательные псевдонимы доступны для оболочек Bash, PowerShell и Zsh. Эти псевдонимы, созданные командой gh copilot alias, предоставляют сокращения для часто используемых функций Copilot:
ghcs – выполняет предложенные команды
ghce — объясняет существующие команды

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍13🔥9😨1
⚡️ GitHub — mshumer/gpt-llm-trainer

• Цель gpt-llm-trainer — упростить процесс обучения модели.

• Система сгенерирует набор данных с нуля и настроит модель LLaMA 2 или GPT-3.5 для пользователя. Генерация набора данных осуществляется с использованием Claude 3 или GPT-4.

• После генерации набора данных система автоматически разделит его на обучающий и проверочный наборы и настроит модель.

• Для использования системы необходимо написать промпт и задать температуру и количество примеров для генерации.

• Обученная модель может быть протестирована с использованием ячеек логического вывода или сохранена на Google Диск.

🖥 GitHub 3.8k⭐️

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥94