Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🌟MusicGPT — приложение для локального запуска моделей, генерирующих музыку

MusicGPT — это приложение, которое позволяет эффективно запускать новейшие модели искусственного интеллекта музыкального поколения локально, на любой платформе и без установки тяжелых зависимостей, таких как Python или фреймворки машинного обучения.

На данный момент он поддерживает только MusicGen от Meta, но планируется обеспечить прозрачную для пользователя поддержку различных моделей генерации музыки.

🖥GitHub

@DevspПодписаться
​​⚡️Semantic Kernel — open-source SDK, который позволяет интегрировать LLM от OpenAI, с Hugging Face и другие, с обычными языками программирования типо C#, Python и Java

Семантическое ядро ​​достигает этого, позволяя вам определять плагины , которые можно объединить в цепочку всего за несколько строк кода.

Однако что делает Semantic Kernel особенным, так это его способность автоматически управлять плагинами с помощью ИИ.

🖥GitHub
🟡Доки

@DevspПодписаться
​​⚡️VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео

VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео.

🖥GitHub
🤗 Демо на HF
🤗 Модель VideoLLaMA 2 на HF

@DevspПодписаться
​​Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера

Архитектура LSTM была предложена в 1997 году немецкими исследователями Зеппом Хохрайтером и Юргеном Шмидхубером. С тех пор она выдержала испытание временем: с ней связано много прорывов в глубоком обучении, в частности именно LSTM стали первыми большими языковыми моделями.

Читать далее
​​📊 NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей

В этой статье я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке.

Читать...
​​Разбор статьи про KAN – принципиально новую архитектуру нейросетей

В основе всех архитектур глубокого обучения лежит многослойный перцептрон (MLP). У него есть веса и нейроны, в которых расположены функции активации. Этой парадигмой ученые пользуются с 1957 года, когда ее предложил Фрэнк Розенблатт. 

Сейчас, спустя 67 лет, исследователи из MIT представили альтернативу MLP – новую архитектуру нейронной сети, получившую название Kolmogorov-Arnold Networks (KAN), в которой реализовано перемещение активаций на «ребра» сети. 

Читать...
​​RecTools – OpenSource библиотека для рекомендательных систем

Сегодня мы решили разобраться, что RecTools умеет, и как с этим работать.

Читать...
​​🖥 Самые интересные публикации за последние дни:

NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей

Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера

MusicGPT — приложение для локального запуска моделей, генерирующих музыку
1
​​⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике

DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo, в задачах, специфичных для кода.

В частности, DeepSeek-Coder-V2 дополнительно проходит предварительное обучение на промежуточной контрольной точке DeepSeek-V2 с дополнительными 6 триллионами токенов.

HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct
Github: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf
Попробовать: https://chat.deepseek.com/sign_in?from=coder

@DevspПодписаться
​​🎙️StreamSpeech: Мощная модель синхронного перевода речи.

StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи.

page: https://ictnlp.github.io/StreamSpeech-site/
paper: https://arxiv.org/abs/2406.03049
code: https://github.com/ictnlp/streamspeech

@DevspПодписаться
​​🌟Open Interpreter — полное управление компьютером при помощи запросов на естественном языке

Open Interpreter предоставляет интерфейс естественного языка для управления компьютером.

Можно общаться с Open Interpreter через ChatGPT-подобный интерфейс прямо в терминале.

🖥GitHub
🟡Доки

@DevspПодписаться
​​😵Он победил LLM RAG: реализуем BM25+ с самых азов

В этой статье мы начнем с самого простого поиска, перейдем к TF-IDF, а затем выведем из него BM25+.

Читать...
​​🌟Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем

Modded-NanoGPT позволяет:
— обучать в 2 раза эффективнее (требуется всего 5B лексем вместо 10B для достижения той же точности)
— имеет более простой код (446 строк вместо 858)

🖥GitHub

@DevspПодписаться
​​😎 Hermes-2-Theta-Llama-3-70B — комбо на основе Hermes 2 Pro и Llama-3 Instruct

Hermes-2 Θ (Theta) 70B — это экспериментальная модель, созданная компанией Nous Research в сотрудничестве с Arcee AI (командой, создавшей MergeKit) на основе Hermes 2 Pro и Llama-3 Instruct.

🤗 Hugging Face

@DevspПодписаться
​​🌟ExVideo — техника тюнинга, позволяющая улучшить возможности моделей генерации видео

ExVideo позволяет модели генерировать в 5 раз больше кадров, при этом требуется всего 1.5 тыс. часов обучения на GPU на датасете из 40 тыс. видео.

🟡Страничка ExVideo
🖥GitHub
🟡Hugging Face
🟡Arxiv

@DevspПодписаться
​​🖥 Самые интересные публикации за последние дни:

StreamSpeech: Мощная модель синхронного перевода речи

Open Interpreter — полное управление компьютером при помощи запросов на естественном языке

Он победил LLM RAG: реализуем BM25+ с самых азов
Работаете в области проектирования ПО и хотите ускорить свой профессиональный рост? Выйти на новый уровень будет гораздо проще с онлайн-магистратурой Яндекса и ИТМО «ПО высоконагруженных систем». Поступив на программу, вы с первого семестра погрузитесь в работу над реальными задачами из индустрии. Собирая ценные кейсы в портфолио, вы прокачаете навыки проектирования сложных систем и управления крупными проектами. Всё это — онлайн, из любой точки мира!

Программа подходит как выпускникам профильных вузов и стажёрам, так и специалистам с опытом. Первым можно будет пройти двухлетний стандартный трек, а вторым — ускоренный, изучая интересующие дисциплины на протяжении года.

Подайте заявку на магистратуру и выйдите на новый уровень в IT!
​​⭐️MorpheuS — реконструкция поверхности с обзором 360° по монокулярному RGB-D видео

MorpheuS — это метод, который может воссоздать 360° поверхности из случайно снятого RGB-D видео.

Ненаблюдаемые области пространства достраиваются с помощью диффузионной модели.

🟡Страничка MorpheuS
🟡Arxiv
🖥GitHub

@DevspПодписаться
​​🌟EvTexture — новый метод апскейлинга видео

В методе EvTexture используется отдельный итеративный модуль улучшения текстуры, который позволяет получать информацию о событиях с высоким временным разрешением.
Этот модуль позволяет постепенно в несколько итераций уточнять текстуру заданных областей и повышать их разрешение.

🟡Страничка EvTexture
🖥GitHub
🟡Arxiv

@DevspПодписаться
​​🌟SEE-2-SOUND — метод генерации сложного пространственного звука на основе изображений и видео

SEE-2-SOUND — новая разработка университета Торонто, передовой метод генерации пространственного звука из изображений, анимации и видео.

Модель состоит из трех основных компонентов: оценка источника звука, генерация звука и пространственная генерация объемного звука.

🟡Страничка SEE-2-SOUND
🖥GitHub
🟡Hugging Face
🟡Arxiv

@DevspПодписаться
​​👁‍🗨 LongVA: Long Context Transfer from Language to Vision

LongVA может обрабатывать 2000 кадров или более 200 тысяч визуальных токенов.

Он обеспечивает самые современные характеристики видео-MME среди моделей 7B.

Github: https://github.com/EvolvingLMMs-Lab/LongVA
Paper: https://arxiv.org/abs/2406.16852
Project: https://lmms-lab.github.io/posts/longva/
Demo: https://longva-demo.lmms-lab.com/

@DevspПодписаться