ИИ Песочница | RnD про ML, AI, Data Science – Telegram
ИИ Песочница | RnD про ML, AI, Data Science
1.88K subscribers
182 photos
8 videos
114 links
AI & ML related papers review, news, opensource updates

GitHub: https://github.com/sb-ai-lab

Contact us for posts and promo: @nepogodstvo
Download Telegram
🔥 GigaChat открыл доступ к своим моделям и представила крупнейший AI open-source в Европе

Команда GigaChat выложила в открытый доступ целую россыпь моделей, которые уже сейчас можно качать, тестировать и встраивать в свои проекты

Что появилось в открытом доступе ↓

➡️ GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных

GitHub | HuggingFace | GitVerse

➡️ GigaAM-v3
Пять моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков

GitHub | HuggingFace | GitVerse

Подробнее в канале разработчиков

➡️ GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам

GitHub | Hugging Face | GitVerse

➡️ Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)

GitHub | GitVerse | Hugging Face | Технический репорт

Подробнее в канале разработчиков

➡️ K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов

GitHub | Hugging Face

Подробнее в канале разработчиков


Код и веса этих моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95👍5
🔥 Sber Conf: Open Source & AI Agents — объединили лучших!

29 ноября Sber AI Lab провела конференцию Sber Conf: Open Source & AI Agents. Лучшие эксперты собрались в ламповой атмосфере, чтобы обсудить развитие Open Source и ИИ-агентов

🔘 19 экспертных выступлений от ведущих команд Сбера, T-Банка, Яндекс, ВТБ, MWS (МТС), ВШЭ, МФТИ, ИТМО, Red Mad Robot и других
🔘 150 офлайн экспертов из Сбера, VK, Яндекс, МТС, Т-Банка, Ламоды, Сколтеха, AIRI, ВШЭ, ИТМО

О чём говорили:
→ Экономика Open Source и как объяснять её ценность топ-менеджменту
→ Инструменты Sber для разработки агентов и ML-моделей
→ Когда и как внедрять ИИ-агентов
→ Научный и бизнес-треки open-source

Главный хайлайт — панельная дискуссия «Будущее Open Source в эпоху LLM» с Николаем Тиденом (Sber AI Lab) и топ-менеджерами Сбера, MWS, T-Банка и Яндекс

🎤 Дискуссия превратилась в живой «баттл» за микрофон.
Делимся самыми горячими темами дискуссии: 👇
• Как не создать «open-source мусор»
• Влияние ИИ-ассистентов на разработку и на нашу daily work
• Изменения в найме разработчиков (что теперь смотрят в резюме)
• Совместная разработка между компаниями
• Реальная ценность open-source для бизнеса


Участники и эксперты отмечают: сильные спикеры, уютная атмосфера, интересные доклады и организация на уровне. Конференция стала точкой сбора комьюнити, где родились новые идеи и коллаборации

Все сошлись во мнении — такое нужно повторять! 💥


#новости
❤️ @sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1684👍1
Forwarded from LightAutoML framework
🦙💡🔮🔍🤖🍃
Конкурс!

Расскажите о своём кейсе использования open-source инструментов Sber AI Lab (LightAutoML, Tsururu, Py-Boost, AutoWoE, RePlay и др) и получите подарки!

Вариант 1:
- Опубликуйте пост на Хабре/Medium или любой другой популярной площадке с рассказом об опыте использования инструментов -- получите мерч Sber AI Lab и другие подарки!
- Заполните короткую форму с описанием вашего кейса. Лучшие кейсы мы будем рады пригласить выступить на наших мероприятиях!

Вариант 2:
Если же вы не можете опубликовать ваш кейс, расскажите о нем в форме с описанием без деталей, мы будем очень благодарны :)

Будем ждать ваши отклики до 1 февраля 2026
➡️ Полный список наших инструментов на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3🦄21🎉1
Media is too big
VIEW IN TELEGRAM
📰 Как данные из медкарт способны повысить выявляемость злокачественных новообразований на 91%

На 32-й конференции SIGKDD по исследованию и интеллектуальному анализу данных (KDD 2026) – одной из топовых конференций в области data mining – исследователи из нашей команды Sber AI Lab, Пётр Филоненко и Павел Блинов, представят работу в Applied Data Science Track

🩺 Работа «Can-SAVE: Deploying Low-Cost and Population-Scale Cancer Screening via Survival Analysis Variables and EHR» посвящена массовому скринингу злокачественных новообразований (ЗНО) с использованием только тех данных, которые есть в электронной медицинской карте (ЭМК) любого пациента

Решение Can-SAVE, сочетающее градиентный бустинг и модели выживаемости, превзошло ряд сильных бейзлайнов и оказалось в Топ-1 по метрике Average Precision, отвечающей за качество ранжирования пациентов

А главное — какие результаты на реальных данных:
🚀 В группе высокого риска от Can-SAVE до 10 раз больше целевых пациентов, чем по текущим медпротоколам
🚀 В 12-месячном пилоте целого региона (426 тыс. человек) ИИ-решение увеличило детектирование ЗНО на +91% по сравнению с плановой диспансеризацией и на +36 п.п. повысило общий охват ЗНО региона

Результаты на реальных данных
В отличие от аналогичных ИИ-решений, требующих узкоспециализированных обследований или многолетней истории пациента, Can-SAVE работает исключительно со стандартными данными ЭМК. Это позволяет обрабатывать данные города-миллионника всего за несколько часов и с лёгкостью масштабировать решение – вплоть до уровня целых стран


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1576
🔄 Вышел новый релиз pytorch-lifestream от нашей команды

Главное в этом релизе — серьёзный фокус на скорость, эффективность памяти и удобство для продакшена.
Рассказываем о важных улучшениях:

➡️ Производительность взлетела
• Переработали ядро обработки данных — на небольших датасетах ускорение более чем на 50%
• Добавили нативную поддержку ONNX
→ На CPU: скорость выросла до 2.5 раз
→ На GPU: прирост до 6%
• Оптимизировали мультимодальный модуль — потребление памяти снизили в 1.5+ раза

➡️ Новый функционал для непрерывных признаков
Библиотека теперь лучше подходит для продвинутого feature engineering по времени:
• PLE (Piecewise Linear Encoding) — для гибкого кодирования непрерывных величин
• Time2Vec — векторные представления времени, улучшающие качество прогнозирования в нейросетевых архитектурах

➡️ Готовность к продакшену
• Исправили различные баги, значительно увеличили покрытие кода тестами
• Добавлен официальный Dockerfile для быстрой сборки окружения и воспроизводимости результатов
• Обновлены докстринги для различных методов; добавлены новые пошаговые туториалы (Notebooks) для быстрого старта.

GitHub
Канал поддержки


#новости
❤️ @sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍84
⚡️ Год завершаем с крутыми анонсами!

Делимся двумя важными новостями, которые точно будут вам интересны

➡️ Kandinsky 5.0 Video — теперь на Video Arena (lmarena.ai)
Наши флагманские модели для генерации видео — Kandinsky 5.0 Video Lite и Pro — представлены на платформе Video Arena от организаторов из UC Berkeley, Carnegie Mellon и UC San Diego. Модель Video Pro ТОП-1 опенсорс модель!
👉 Без VPN ссылки не открываются

➡️ Новая модель для автодополнения кода в GigaCode
Ребята выпустили большую статью на Хабре где подробно разбирают свежую модель для автоматического дополнения кода
📖 Читать и поддержать можно по ссылке


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒43🔥3
🎯 CNN для неравномерных данных: как взять и обработать событийные ряды без потерь

Статью COTIC: Embracing Non-uniformity in Event Sequence Data via Multilayer Continuous Convolution приняли в журнал IEEE Access (Q1)

⚡️ В чём соль?
Обычные CNN отлично работают на равномерных сетках (например, картинки). Но как только даёшь им событийные данные с разными промежутками времени — они «ломаются» из-за необходимости дискретизации. Авторы статьи придумали COTIC — по сути, полноценную CNN, но со свёртками, работающими в непрерывном времени. Это позволяет модели «чувствовать» точные временные промежутки и не терять информацию

🔘 Работает с raw-данными
🔘 Учит длинные зависимости, но без рекурсивных сложностей
🔘 Создает универсальные эмбеддинги, которые потом можно использовать для прогноза, классификации или поиска аномалий

А работает ли?
Да, и очень! На стандартных датасетах по предсказанию следующего события COTIC обошел популярные RNN-, Transformer- и CNN-подходы, показав лучший средний ранг. И на финансовых и рекомендательных данных эмбеддинги показали себя отлично

Статья написана с совместным авторством команд Sber AI Lab и Сколтех


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥113😎1
Forwarded from СберСтудент
🔝 КАК ДЕЛАТЬ БОЛЬШИЕ ML-ПРОЕКТЫ?

Мы поговорили с Алиной Костроминой и собрали её путь от стажёра до руководителя направления по анализу данных и собственного проекта Tsururu в карточках

Ещё несколько советов от Алины👇

🔘 Чтобы работать над проектами высокого уровня, одних скиллов недостаточно. Важнее реально любить проект. Задачи будут меняться, появятся новые идеи, фичи и ответственность, но должен оставаться тот самый «огонёк», из-за которого хочется допиливать, улучшать и иногда полностью переосмыслять уже сделанное

🔘 Совет тем, кто только начинает путь в ML/DS: идите туда, где вам очень интересно и немного страшно. Сомневаться и бояться, что не получится, нормально. Но почти всегда усилия окупаются, и результат выходит даже лучше, чем вы ожидали

🔘 Теорию важно сразу закреплять практикой — самостоятельно реализовывать алгоритмы, а со временем переходить от учебников к научным статьям. Так начинает складываться понимание, как модели работают изнутри, где их ограничения и как их можно улучшать


Если ты хочешь попасть на стажировку или уже пробуешь себя в ML, напиши в комментариях, на каком этапе ты сейчас! А мы будем разбирать такие кейсы чаще 🚀

В Центре практического ИИ работает много молодых специалистов над прикладными решениями. Больше о их проектах — по ссылке🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍43