Machine learning Interview – Telegram
Machine learning Interview
33.3K subscribers
1.45K photos
111 videos
13 files
997 links
Разбираем вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейронным сетям, Python.

Вопросы - @notxxx1


@itchannels_telegram -🔥лучшие it каналы

РКН: clck.ru/3FmwRz
Download Telegram
🎉 MiMo-V2-Flash - бесплатный API доступен на ModelScope

Первый крупный релиз Xiaomi после прихода Fuli Luo — и сразу ставка на реальные agentic-сценарии, а не «лабораторные» демо.

MiMo-V2-Flash - открытая высокопроизводительная MoE-модель:
- 309B параметров всего / 15B активных
- Контекст 256K токенов
- 150+ токенов в секунду благодаря нативному Multi-Token Prediction

🔥 Ключевые преимущества для разработчиков:
- Гибридное внимание (5:1 SWA + Global)
→ в 6 раз меньше KV-кэша без потери длинного контекста
- 73.4% на SWE-Bench Verified — новый SOTA среди open-source моделей
- Качество рассуждений на уровне DeepSeek-V3.2, но заметно выше скорость в реальных задачах

API-ready
Отлично подходит для:
- агентных систем
- длинных reasoning-пайплайнов
- быстрых и отзывчивых AI-ассистентов

Модель доступна на ModelScope:
https://modelscope.cn/models/XiaomiMiMo/MiMo-V2-Flash

#AI #LLM #MoE #OpenSource #AgenticAI #Xiaomi #ModelScope
10👍5🥰2🤣2
Руководитель Школы анализа данных Яндекса Алексей Толстиков рассказал, как в 2026 году стать востребованным ИТ- и ML-специалистом. В новом выпуске подкаста Machine Learning Podcast он поделился инсайтами о том, фундаментальная математическая база сегодня необходима для карьеры в ИИ.

Чтобы оставаться востребованным, специалисту необходимо:

• глубоко понимать алгоритмы — это даёт преимущество на рынке и открывает двери в любые топовые компании;
• сочетать теорию с реальными задачами индустрии — гонка только за практикой не работает;
• развивать скилл задавать живые вопросы и вести обсуждения — нейросети этого не заменят;
• не бояться сложной и долгой учёбы — инвестиции в образование окупаются свободой выбора работы в ведущих компаниях.

📌 Послушать подкаст можно здесь
12👍9
T5Gemma 2 - новое поколение энкодер-декодерных моделей от Google

Google представила T5Gemma 2 - энкодер-декодерную архитектуру, построенную на базе идей и ряда улучшений Gemma 3. Это не просто апдейт, а полноценный шаг вперед для задач генерации, перевода, суммаризации и мультимодального понимания.

T5Gemma 2 объединяет сильные стороны классического подхода T5 (encoder-decoder) с архитектурными улучшениями Gemma нового поколения, делая модель более эффективной, масштабируемой и универсальной.

Основные особенности
- Энкодер-декодерная архитектура нового поколения
- Общие эмбеддинги для энкодера и декодера, что снижает размер модели
- Объединенное self- и cross-attention в декодере для более эффективных вычислений
- Поддержка длинного контекста до 128 000 токенов
- Мультимодальность - работа с текстом и изображениями
- Многоязычная поддержка более 140 языков

Размеры моделей
T5Gemma 2 доступна в нескольких конфигурациях:
- 270M + 270M параметров
- 1B + 1B параметров
- 4B + 4B параметров

Такие размеры позволяют использовать модель как в исследованиях, так и в продакшене, включая on-device сценарии.

Модель демонстрирует отличное понимание контекста, более стабильную генерацию и высокое качество работы с длинными последовательностями. Особенно хорошо проявляет себя в задачах суммаризации, QA, перевода и мультимодальных сценариях.

Где это полезно
- Суммаризация документов
- Машинный перевод
- Поиск и RAG-системы
- Мультимодальные ассистенты
- Обработка длинных текстов без агрессивного чанкинга

T5Gemma 2 показывает, что encoder-decoder подход по-прежнему актуален и может конкурировать с decoder-only моделями, особенно в задачах понимания и структурированной генерации.

https://blog.google/technology/developers/t5gemma-2/
12👍4🔥3
🧠 Новая работа учит модели рассуждений «думать» на крошечном символическом языке — сохранять точность, но тратить в 4-16 раз меньше токенов.

Обычные reasoning-модели вроде DeepSeek R1 хорошо решают математику, но пишут длинные цепочки «саморазмышлений», из-за чего инференс становится медленным и дорогим.

Чтобы сократить это, авторы создают язык Mentalese - каждый шаг это короткий оператор + маленькое вычисление. Они собирают ~40K математических трейсов в этом формате.

Сначала небольшие модели дообучают на этих трейсах так, что каждая задача решается одним коротким Mentalese-скриптом. Длина резко сокращается, но падает точность.

Далее применяют RL с проверяющим: модель генерирует множество кандидатов, а версификатор оценивает их правильность.

Метод Shorter Length Preference Optimization сохраняет главным вознаграждение за корректность, но добавляет небольшой бонус за более короткий правильный трейс — при этом не наказывает единственный длинный правильный ответ.

Так рождаются модели ORION, они сохраняют сильную математическую точность, но потребляют в 4–16 раз меньше reasoning-токенов, делая обучение и инференс значительно дешевле.

📌 Paper: “ORION: Teaching Language Models to Reason Efficiently in the Language of Thought”
arxiv.org/abs/2511.22891
🔥86
Реклама
АО НПК «Криптонит»
ИНН 9701115253
Erid: 2Vtzqvk26d8
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️«Криптонит» объявляет Новогодний розыгрыш!

Мы подарим два эксклюзивных новогодних набора нашим подписчикам — распаковку подарков оставили в видео🖤

Что для этого нужно сделать?
🟦Подписаться на наш канал «Криптонит. Разработка, наука, шифрование» (и не отписываться)
🟦Нажать внизу на кнопку «Участвовать»

Что в новогоднем подарке?
🟦Уникальный сборник рассказов «Доказательство чуда». В него входят редкие произведения научной фантастики известных советских и российских авторов: Кира Булычёва, Ивана Ефремова, Сергея Другаля и других. Этот сборник специально создан «Криптонитом» для друзей нашего бренда
🟦Мощная портативная зарядка
🟦Снимающиеся наклейки на ноутбук с самыми нужными фразами (например, «Не деплой в пятницу»)
🟦Стильная ремувка

Результаты подведём 22 декабря в 15:00. Бот выберет победителей случайным образом.

Полные правила конкурса можно почитать тут.
#конкурс #мерч
Please open Telegram to view this post
VIEW IN TELEGRAM
😁62😭1
🚀 Google выложила разбор того, как Gemini 3 Pro стала мощной системой для визуального понимания.

Она не просто “видит”, что на изображении — она рассуждает о сцене.

📌 Ключевые примеры возможностей:
• “Дерендеринг” — превращает грязные PDF и скриншоты в чистый код
• Понимание пространственных координат — полезно для робототехники
• Анализ сложных интерфейсов и динамичных видео
• Отображение документов, экранов, пространств и реальных сцен одной моделью

💡 Самое интересное — Gemini 3 Pro может генерировать код приложений по длинным видео и даёт разработчикам настройку точности: баланс между качеством и стоимостью обработки.

Итог: это уже не распознавание картинок, а полноценная визуальная система рассуждений для агентов, роботов и инструментов разработки.

https://blog.google/technology/developers/gemini-3-pro-vision/
👏93