🔥 GigaChat открыл доступ к своим моделям и представила крупнейший AI open-source в Европе
Команда GigaChat выложила в открытый доступ целую россыпь моделей, которые уже сейчас можно качать, тестировать и встраивать в свои проекты
Что появилось в открытом доступе ↓
➡️ GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace | GitVerse
➡️ GigaAM-v3
Пять моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse
Подробнее в канале разработчиков
➡️ GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | Hugging Face | GitVerse
➡️ Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
GitHub | GitVerse | Hugging Face | Технический репорт
Подробнее в канале разработчиков
➡️ K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
GitHub | Hugging Face
Подробнее в канале разработчиков
Код и веса этих моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях
#новости
❤ @sb_ai_lab
Команда GigaChat выложила в открытый доступ целую россыпь моделей, которые уже сейчас можно качать, тестировать и встраивать в свои проекты
Что появилось в открытом доступе ↓
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace | GitVerse
Пять моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse
Подробнее в канале разработчиков
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | Hugging Face | GitVerse
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
GitHub | GitVerse | Hugging Face | Технический репорт
Подробнее в канале разработчиков
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
GitHub | Hugging Face
Подробнее в канале разработчиков
Код и веса этих моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤5👍5
ИИ Песочница | RnD про ML, AI, Data Science
Ждем вас по ссылке
Актуальная программа здесь: https://developers.sber.ru/kak-v-sbere/events/sberconf_november_2025
Присоединяйтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12⚡5👍5
🔥 Sber Conf: Open Source & AI Agents — объединили лучших!
29 ноября Sber AI Lab провела конференцию Sber Conf: Open Source & AI Agents. Лучшие эксперты собрались в ламповой атмосфере, чтобы обсудить развитие Open Source и ИИ-агентов
🔘 19 экспертных выступлений от ведущих команд Сбера, T-Банка, Яндекс, ВТБ, MWS (МТС), ВШЭ, МФТИ, ИТМО, Red Mad Robot и других
🔘 150 офлайн экспертов из Сбера, VK, Яндекс, МТС, Т-Банка, Ламоды, Сколтеха, AIRI, ВШЭ, ИТМО
О чём говорили:
→ Экономика Open Source и как объяснять её ценность топ-менеджменту
→ Инструменты Sber для разработки агентов и ML-моделей
→ Когда и как внедрять ИИ-агентов
→ Научный и бизнес-треки open-source
Главный хайлайт — панельная дискуссия «Будущее Open Source в эпоху LLM» с Николаем Тиденом (Sber AI Lab) и топ-менеджерами Сбера, MWS, T-Банка и Яндекс
🎤 Дискуссия превратилась в живой «баттл» за микрофон.
Делимся самыми горячими темами дискуссии:👇
Участники и эксперты отмечают: сильные спикеры, уютная атмосфера, интересные доклады и организация на уровне. Конференция стала точкой сбора комьюнити, где родились новые идеи и коллаборации
Все сошлись во мнении — такое нужно повторять! 💥
#новости
❤️ @sb_ai_lab
29 ноября Sber AI Lab провела конференцию Sber Conf: Open Source & AI Agents. Лучшие эксперты собрались в ламповой атмосфере, чтобы обсудить развитие Open Source и ИИ-агентов
О чём говорили:
→ Экономика Open Source и как объяснять её ценность топ-менеджменту
→ Инструменты Sber для разработки агентов и ML-моделей
→ Когда и как внедрять ИИ-агентов
→ Научный и бизнес-треки open-source
Главный хайлайт — панельная дискуссия «Будущее Open Source в эпоху LLM» с Николаем Тиденом (Sber AI Lab) и топ-менеджерами Сбера, MWS, T-Банка и Яндекс
🎤 Дискуссия превратилась в живой «баттл» за микрофон.
Делимся самыми горячими темами дискуссии:
• Как не создать «open-source мусор»
• Влияние ИИ-ассистентов на разработку и на нашу daily work
• Изменения в найме разработчиков (что теперь смотрят в резюме)
• Совместная разработка между компаниями
• Реальная ценность open-source для бизнеса
Участники и эксперты отмечают: сильные спикеры, уютная атмосфера, интересные доклады и организация на уровне. Конференция стала точкой сбора комьюнити, где родились новые идеи и коллаборации
Все сошлись во мнении — такое нужно повторять! 💥
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16❤8⚡4👍1
Forwarded from LightAutoML framework
Конкурс!
Расскажите о своём кейсе использования open-source инструментов Sber AI Lab (LightAutoML, Tsururu, Py-Boost, AutoWoE, RePlay и др) и получите подарки!
Вариант 1:
- Опубликуйте пост на Хабре/Medium или любой другой популярной площадке с рассказом об опыте использования инструментов -- получите мерч Sber AI Lab и другие подарки!
- Заполните короткую форму с описанием вашего кейса. Лучшие кейсы мы будем рады пригласить выступить на наших мероприятиях!
Вариант 2:
Если же вы не можете опубликовать ваш кейс, расскажите о нем в форме с описанием без деталей, мы будем очень благодарны :)
Будем ждать ваши отклики до 1 февраля 2026
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3🦄2❤1🎉1
Media is too big
VIEW IN TELEGRAM
На 32-й конференции SIGKDD по исследованию и интеллектуальному анализу данных (KDD 2026) – одной из топовых конференций в области data mining – исследователи из нашей команды Sber AI Lab, Пётр Филоненко и Павел Блинов, представят работу в Applied Data Science Track
🩺 Работа «Can-SAVE: Deploying Low-Cost and Population-Scale Cancer Screening via Survival Analysis Variables and EHR» посвящена массовому скринингу злокачественных новообразований (ЗНО) с использованием только тех данных, которые есть в электронной медицинской карте (ЭМК) любого пациента
Решение Can-SAVE, сочетающее градиентный бустинг и модели выживаемости, превзошло ряд сильных бейзлайнов и оказалось в Топ-1 по метрике Average Precision, отвечающей за качество ранжирования пациентов
А главное — какие результаты на реальных данных:
Результаты на реальных данных
В отличие от аналогичных ИИ-решений, требующих узкоспециализированных обследований или многолетней истории пациента, Can-SAVE работает исключительно со стандартными данными ЭМК. Это позволяет обрабатывать данные города-миллионника всего за несколько часов и с лёгкостью масштабировать решение – вплоть до уровня целых стран
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤7 6
Главное в этом релизе — серьёзный фокус на скорость, эффективность памяти и удобство для продакшена.
Рассказываем о важных улучшениях:
• Переработали ядро обработки данных — на небольших датасетах ускорение более чем на 50%
• Добавили нативную поддержку ONNX
→ На CPU: скорость выросла до 2.5 раз
→ На GPU: прирост до 6%
• Оптимизировали мультимодальный модуль — потребление памяти снизили в 1.5+ раза
Библиотека теперь лучше подходит для продвинутого feature engineering по времени:
• PLE (Piecewise Linear Encoding) — для гибкого кодирования непрерывных величин
• Time2Vec — векторные представления времени, улучшающие качество прогнозирования в нейросетевых архитектурах
• Исправили различные баги, значительно увеличили покрытие кода тестами
• Добавлен официальный Dockerfile для быстрой сборки окружения и воспроизводимости результатов
• Обновлены докстринги для различных методов; добавлены новые пошаговые туториалы (Notebooks) для быстрого старта.
Канал поддержки
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍8❤4
Делимся двумя важными новостями, которые точно будут вам интересны
Наши флагманские модели для генерации видео — Kandinsky 5.0 Video Lite и Pro — представлены на платформе Video Arena от организаторов из UC Berkeley, Carnegie Mellon и UC San Diego. Модель Video Pro ТОП-1 опенсорс модель!
👉 Без VPN ссылки не открываются
Ребята выпустили большую статью на Хабре где подробно разбирают свежую модель для автоматического дополнения кода
📖 Читать и поддержать можно по ссылке
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒4❤3🔥3
🎯 CNN для неравномерных данных: как взять и обработать событийные ряды без потерь
Статью COTIC: Embracing Non-uniformity in Event Sequence Data via Multilayer Continuous Convolution приняли в журнал IEEE Access (Q1)
⚡️ В чём соль?
Обычные CNN отлично работают на равномерных сетках (например, картинки). Но как только даёшь им событийные данные с разными промежутками времени — они «ломаются» из-за необходимости дискретизации. Авторы статьи придумали COTIC — по сути, полноценную CNN, но со свёртками, работающими в непрерывном времени. Это позволяет модели «чувствовать» точные временные промежутки и не терять информацию
🔘 Работает с raw-данными
🔘 Учит длинные зависимости, но без рекурсивных сложностей
🔘 Создает универсальные эмбеддинги, которые потом можно использовать для прогноза, классификации или поиска аномалий
А работает ли?
Да, и очень! На стандартных датасетах по предсказанию следующего события COTIC обошел популярные RNN-, Transformer- и CNN-подходы, показав лучший средний ранг. И на финансовых и рекомендательных данных эмбеддинги показали себя отлично
Статья написана с совместным авторством команд Sber AI Lab и Сколтех
#новости
❤ @sb_ai_lab
Статью COTIC: Embracing Non-uniformity in Event Sequence Data via Multilayer Continuous Convolution приняли в журнал IEEE Access (Q1)
Обычные CNN отлично работают на равномерных сетках (например, картинки). Но как только даёшь им событийные данные с разными промежутками времени — они «ломаются» из-за необходимости дискретизации. Авторы статьи придумали COTIC — по сути, полноценную CNN, но со свёртками, работающими в непрерывном времени. Это позволяет модели «чувствовать» точные временные промежутки и не терять информацию
А работает ли?
Да, и очень! На стандартных датасетах по предсказанию следующего события COTIC обошел популярные RNN-, Transformer- и CNN-подходы, показав лучший средний ранг. И на финансовых и рекомендательных данных эмбеддинги показали себя отлично
Статья написана с совместным авторством команд Sber AI Lab и Сколтех
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11⚡3😎1
Forwarded from СберСтудент
Мы поговорили с Алиной Костроминой и собрали её путь от стажёра до руководителя направления по анализу данных и собственного проекта Tsururu в карточках
Ещё несколько советов от Алины👇 🔘 Чтобы работать над проектами высокого уровня, одних скиллов недостаточно. Важнее реально любить проект. Задачи будут меняться, появятся новые идеи, фичи и ответственность, но должен оставаться тот самый «огонёк», из-за которого хочется допиливать, улучшать и иногда полностью переосмыслять уже сделанное🔘 Совет тем, кто только начинает путь в ML/DS: идите туда, где вам очень интересно и немного страшно. Сомневаться и бояться, что не получится, нормально. Но почти всегда усилия окупаются, и результат выходит даже лучше, чем вы ожидали🔘 Теорию важно сразу закреплять практикой — самостоятельно реализовывать алгоритмы, а со временем переходить от учебников к научным статьям. Так начинает складываться понимание, как модели работают изнутри, где их ограничения и как их можно улучшать
Если ты хочешь попасть на стажировку или уже пробуешь себя в ML, напиши в комментариях, на каком этапе ты сейчас! А мы будем разбирать такие кейсы чаще
В Центре практического ИИ работает много молодых специалистов над прикладными решениями. Больше о их проектах — по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍4⚡3