ИИ Песочница | RnD про ML, AI, Data Science – Telegram
ИИ Песочница | RnD про ML, AI, Data Science
1.91K subscribers
175 photos
8 videos
110 links
AI & ML related papers review, news, opensource updates

GitHub: https://github.com/sb-ai-lab

Contact us for posts and promo: @nepogodstvo
Download Telegram
⚡️ Как работать в AI и не потерять вдохновение?

Блиц с Галиной Зубковой! Узнали, какими задачами занимается, какие фокусы в исследованиях и что стало главной трудностью.

Листайте картинки и мотивируйтесь 🌷


#интервью
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16💅7🦄6👍2🙈2👏1
Наши друзья из Сколтеха совместно со Сбером запустили АНТИолимпиаду, где задачи придумываете вы.

Если вы студент 4 курса бакалавриата и шарите в компьютерных науках, выбирайте одну из 55 тем, придумывайте 10 вопросов и отправляйте до 30 марта

Победителям профит: денежный сертификат, бонус при поступлении в магистратуру «Науки о данных» и fast-track на открытые стажировки в Сколтех и Сбер.

➡️ За подробностями сюда!


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👍3🤪1
📰 Как ИИ помогает разбираться в нормативных документах?

В конце января Юлия Беликова приняла участие в международной конференции COLING 2025 в Абу-Даби, где в рамках воркшопа RegNLP постер по статье RAGulator: Effective RAG for Regulatory Question Answering.

В статье предложен улучшенный подход RAG (Retrieval-Augmented Generation), который:
Использует гибридный поиск, чтобы находить самый релевантный контекст.
Включает модификацию процесса декодирования языковой модели для повышения качества генерируемых ответов.

Такие решения помогают автоматизировать работу с нормативными актами и быстрее находить нужные данные.


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍63💅2
📰 Как заставить модель не только слышать, но и чувствовать?

Наша команда, AIRI и МФТИ собрали CA-SER — модель, которая ловит эмоции в голосе. В ход пошли предобученная wav2vec 2.0 и акустические фичи (MFCC), а чтобы всё это работало синхронно, прикрутили механизм перекрёстного внимания.

Что на выходе?
🔘 Реалтайм - детект эмоций. Анализирует не только текст, но и акустику (громкость, тон, настроение)
🔘 Open - source — можно затащить в голосовые ассистенты, call-центры, медицину, кастомизировать под свои таски
🔘 CA-SER показала точность 74,6% на сложном датасете IEMOCAP, опередив многие аналоги
🔘 Статья зашла на топовую европейскую конфу ECAI 2024

Код можно пощупать здесь!


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
👍765
🤖 From LLMs to AI Agents

Запускаем открытые семинары про AI, и первый уже скоро!

6 марта в 17:00 Миле Митрович (Sber AI Lab) расскажет, как LLM выходят за рамки чат-ботов и становятся частью агентных систем

Что обсудим:
🔘 Сильные и слабые стороны LLM в реальных задачах
🔘 Как компаунд-системы делают их умнее
🔘 Что такое ИИ-агенты и зачем в них LLM

Послушать можно по ссылке


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍4👾21🕊1
📰 Датасет для анализа коронарных сосудов: обнаружение выбросов и оценка неопределенности

Делимся статьей с датасетом и бенчмарком для анализа видео коронарных сосудов в рентгеновских лучах.

Датасет отлично подходит для исследования outlier detection и оценки неопределённости: большинство записей - это нормальные случаи, но можно потестить устойчивость моделей на out-of-distribution примерах — например, когда в кадре появляется электрод.

Есть такие случаи, где в силу специфики анатомии,
даже опытные специалисты не сходятся во мнении - языком ML это случаи, которые находятся рядом с разделяющей поверхностью.

Статью подготовили вместе с учеными Тюменского кардиоцентра (филиал Томского НИМЦ).

Если копаете медицину и компьютерное зрение — вам сюда.


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👏4👍21
⚡️ Мультимодальность, приклад, CV

Продолжаем открытые семинары про AI — следующий уже в четверг!

13 марта в 17:00 Дмитрий Сенюшкин (AIRI) расскажет про мультимодальное обучение в прикладных задачах компьютерного зрения

Что обсудим:
➡️ Практические аспекты построения и обучения нейросетевых CV - моделей, задействующих несколько различных источников данных
➡️ Оригинальные способы обучения многоцелевых моделей
➡️ Архитектурные лайфхаки для улучшения качества в прикладных задачах

Заходите послушать по ссылке


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍732
Новые LLM: быстрее, меньше, умнее

Продолжается гонка уменьшения размеров моделей и ускорения инференса без потери качества.

🤖 Google представил Gemma 3
Новые мультимодальные версии мультиязыковых моделей размером от 1 до 27 миллиардов параметров, которые можно запустить на одной GPU.

Чуть раньше Миле, наш коллега и эксперт, отобрал еще 2 свеженьких прорывных релиза LLM:

🤖 Alibaba выкатила QwQ-32B
Легковесный аналог Deepseak-R1 671b в ризонинг и кодинг с применением RL -> та же точность и в 20 раз меньшая модель!

🤖 Mercury от Inception Labs
Первая коммерческая диффузионная LLM с параллельной генерацией текста. Итог: 1000+ токенов/сек на H100, что в 5–10 раз быстрее авторегрессионных моделей.

Чекай детали по ссылкам!


#новости
@sb_ai_lab
👍9🔥5💯41🤯1💅1
🤖ИИ-учёный выходит на сцену: впервые полностью написанная ИИ статья успешно прошла рецензирование на воркшоп топовой конференции!

🚀 Sakana AI представила первую рецензируемую статью, полностью созданную AI Scientist-v2. Новая версия ИИ-ученого сама сгенерировала идею, провела эксперименты, обработала данные и написала научный текст, который успешно прошёл анонимное рецензирование на воркшопе при ICLR (одной из лучших мировых конференций)🤯. Все три рецензента рекомендовали принять статью!

📌 Достигнуто значительное улучшение по сравнению с первой версией (arxiv), в которой впервые была представлена концепция ИИ-учёного.

Несомненно, у нас, как у регулярно публикующихся ученых, процедура рецензирования вызывает вопросы. Например, в списке литературы статьи всего 8 источников (в несколько раз меньше, чем в типовых статьях), да еще и при их использовании возникли фактические «ляпы» - вместо статьи про LSTM от Шмидхубера AI Scientist процитировал книгу Гудфеллоу. Тем не менее …. 👣

🔬 Что это меняет в науке?

Автоматизация исследований, ускорение открытий.
Рост качества ИИ-генерированных научных работ.
Ужесточение процедуры рецензирования

Однако остаются открытые вопросы об этике, авторстве и достоверности результатов, созданных ИИ…

Готовы ли мы к будущему, где ИИ будет не только писать статьи, но и делать открытия? А к резкому росту количества "мусорных" публикаций?

Пишите свои мысли в комментариях к посту 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👾5👍2🤯1😡1
🔄 Вышел новый релиз RePlay от наших исследователей рекомендаций

Завезли версию 0.18.1 либы RePlay с важными улучшениями, которые ускоряют инференс, улучшают обработку данных и добавляют новые возможности

Что изменилось?

➡️ Буст инференса на CPU
Модели Bert4Rec и SasRec летают в 2–5 раз быстрее на CPU благодаря OpenVino
➡️ Инференс по кандидатам
Теперь можно выдавать рекомендации не из всего каталога, а из заданного списка
➡️ Улучшена обработка категориальных признаков
Добавлена поддержка категориальных и числовых признаков
➡️ LinUCB — новый алгоритм
Добавили LinUCB — мощный метод контекстных бандитов для более точных персонализированных рекомендаций
➡️ Discretizer — умная дискретизация
Позволяет разбивать числовые данные на интервалы с помощью "жадной" стратегии или квантилей

🔮 Подробности читайте по ссылке
RePlay 0.18.1 Release notes


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7🦄3👍21🎉1💘1
⚡️ COLING'25: обзоры трендов

20 марта в 17:00 снова встречаемся на открытом семинаре про AI — Юлия Беликова (Sber AI Lab) разберет самое интересное с COLING'25!

Обсудим, какие направления сейчас в топе:
➡️ Графы знаний — интеграция графов знаний с LLM для автоматизации и улучшения контекстного анализа
➡️ Ризонинг — методы эффективного дообучения и контролируемой генерации для домен-специфичных задач
➡️ Интерпретация — инструменты интерпретации внутренних состояний LLM и LoRA адаптеров

Присоединяйтесь онлайн!


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👏21👍1
⚡️ Как любовь к математике привела в машинное обучение?

Блиц с Дашей, ведущим специалистом по исследованию данных в Sber AI Lab! Узнали, какими задачами она занимается, какие подходы использует и что приносит удачу!

Листайте и заряжайтесь 🚀


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13🦄5❤‍🔥3👍3🔥1👏1