Cryfish: Как научить большую языковую модель слышать и понимать звуки?
Сегодня мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.
Читать | DATApedia
Сегодня мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.
Читать | DATApedia
👍3
Создаем простую систему RAG на Python
Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.
Читать | DATApedia
Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.
Читать | DATApedia
Claude Opus 4.5 и конец привычной разработки
Статья о том, почему Claude Opus 4.5 стал переломным моментом в ИИ-разработке. Автор на реальных проектах показывает, как ИИ-агенты уже сегодня способны собирать полноценные приложения — от UI до бэкенда — за считанные часы, и рассуждает о том, зачем человеку вообще читать код в мире AI-first разработки.
Читать | DATApedia
Статья о том, почему Claude Opus 4.5 стал переломным моментом в ИИ-разработке. Автор на реальных проектах показывает, как ИИ-агенты уже сегодня способны собирать полноценные приложения — от UI до бэкенда — за считанные часы, и рассуждает о том, зачем человеку вообще читать код в мире AI-first разработки.
Читать | DATApedia
👍1
Функция потерь: как алгоритм понимает, что он ошибся
Представьте, что вы играете в дартс. Сначала ваши дротики разлетаются по всей мишени, но с каждой попыткой вы постепенно приближаетесь к заветному центру. Человек интуитивно понимает, что нужно скорректировать бросок: сильнее, выше, левее или правее. Примерно так же работает и алгоритм машинного обучения. Только вместо интуиции там есть функция потерь.
Читать | DATApedia
Представьте, что вы играете в дартс. Сначала ваши дротики разлетаются по всей мишени, но с каждой попыткой вы постепенно приближаетесь к заветному центру. Человек интуитивно понимает, что нужно скорректировать бросок: сильнее, выше, левее или правее. Примерно так же работает и алгоритм машинного обучения. Только вместо интуиции там есть функция потерь.
Читать | DATApedia
🔥 Твоя статья может принести 1 миллион рублей!
ВТБ и Институт ИИ МГУ открыли прием заявок на конкурс Data Fusion Awards для data scientists и ML-исследователей. Ищут лучшие научные статьи 2025 года по ИИ.
Зачем участвовать:
🔵 Продемонстрировать прорыв в математике ИИ, оптимизации или глубоком обучении
🔵 Получить признание от лидеров отрасли
🔵 Забрать до 1 млн рублей из призового фонда 3 млн
🔵 Усилить резюме аффилиацией с топ-конкурсом
👉 Подавать заявку до конца января на сайте
ВТБ и Институт ИИ МГУ открыли прием заявок на конкурс Data Fusion Awards для data scientists и ML-исследователей. Ищут лучшие научные статьи 2025 года по ИИ.
Зачем участвовать:
👉 Подавать заявку до конца января на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
«Галлюцинации LLM — это не баг»: профессор математики объясняет, почему ИИ не перестанет врать
Владимир Крылов, профессор математики, научный консультант Artezio и один из самых глубоких русскоязычных экспертов по применению ИИ в разработке, дал интервью по итогам года. Мы поговорили о том, почему reasoning-модели галлюцинируют вдвое чаще обычных (и это математически неизбежно), почему OpenAI объявил «код красный» и отстаёт от Google, и правда ли, что программисты, умеющие писать код только руками, скоро вымрут как вид. Спойлер: Паваротти не умел читать ноты, и это кое-что говорит о будущем vibe-coding.
Читать | DATApedia
Владимир Крылов, профессор математики, научный консультант Artezio и один из самых глубоких русскоязычных экспертов по применению ИИ в разработке, дал интервью по итогам года. Мы поговорили о том, почему reasoning-модели галлюцинируют вдвое чаще обычных (и это математически неизбежно), почему OpenAI объявил «код красный» и отстаёт от Google, и правда ли, что программисты, умеющие писать код только руками, скоро вымрут как вид. Спойлер: Паваротти не умел читать ноты, и это кое-что говорит о будущем vibe-coding.
Читать | DATApedia
Анатомия трансформеров: почему обычный Self-Attention больше не используют
В этой статье я постараюсь рассказать, как механизм внимания помогает языковым моделям обрабатывать тысячи слов контекста и почему с этим не справлялись в свое время обычные RNN. В конце статьи я расскажу про проблемы классического attention и современные адаптации.
Читать | DATApedia
В этой статье я постараюсь рассказать, как механизм внимания помогает языковым моделям обрабатывать тысячи слов контекста и почему с этим не справлялись в свое время обычные RNN. В конце статьи я расскажу про проблемы классического attention и современные адаптации.
Читать | DATApedia
Линейная регрессия, встряска рейтинга и первое место. Часть 1: Ёлочка, живи
Сказ о том, как после долгого перерыва я "взял в руки шашки" (поучаствовал в ML-соревновании) и дотащил задачу на "таблички" до первого места на финальном "приватном" лидерборде с помощью простейшей подготовки фич и классической линейной регрессии с регуляризацией, внезапно обогнав при этом всех модных катбустеров, банально переобучившихся на "паблике".
Читать | DATApedia
Сказ о том, как после долгого перерыва я "взял в руки шашки" (поучаствовал в ML-соревновании) и дотащил задачу на "таблички" до первого места на финальном "приватном" лидерборде с помощью простейшей подготовки фич и классической линейной регрессии с регуляризацией, внезапно обогнав при этом всех модных катбустеров, банально переобучившихся на "паблике".
Читать | DATApedia
👍3
Как оптимизация промптов превратилась из шаманства в инженерную дисциплину
Ещё пару лет назад промпт-инжиниринг выглядел как подбор удачного заклинания: "а давай добавим think step by step, "а давай попросим быть аккуратнее" и о приправим xml-тегами".
Сегодня это типовая задача оптимизации в условиях чёрного ящика.
Промпт -> это не текст, а параметр модели, и оптимизировать его нужно алгоритмически, а не интуитивно.
Читать | DATApedia
Ещё пару лет назад промпт-инжиниринг выглядел как подбор удачного заклинания: "а давай добавим think step by step, "а давай попросим быть аккуратнее" и о приправим xml-тегами".
Сегодня это типовая задача оптимизации в условиях чёрного ящика.
Промпт -> это не текст, а параметр модели, и оптимизировать его нужно алгоритмически, а не интуитивно.
Читать | DATApedia
На что потратить 3 000 000 рублей?
Именно столько всего заработают победители Data Fusion Contest 2026 — ежегодного соревнования по машинному обучению!
Организаторы соревнования — ИТ-холдинг Т1 и ВТБ.
⚡ Формат — онлайн: участвовать можно из любой точки мира.
В этом году участникам предстоит выполнить три задачи:
☑️ «Страж» — про вычисление подозрительных операций в банке;
☑️ «Киберполка» — про подбор нужных финансовых продуктов из 41 варианта.
☑️ «Герои» — про создание идеальных маршрутов с учетом времени.
📣 Даты проведения соревнования: с 9 февраля по 30 марта 2026 года. Финалисты смогут презентовать свои решения на конференции Data Fusion 2026 в Москве 8-9 апреля. Там же состоится торжественная церемония награждения победителей.
Data Fusion Contest 2026:
🔵 прокачай себя и стань частью комьюнити DS в России;
🔵 попробуй силы в уникальных кейсах, которые выходят за рамки ежедневной рутины;
🔵 получи внушительное денежное вознаграждение.
Ну что, хватит читать — пора действовать➡ жми на ссылку!
Информация о рекламодателе
Именно столько всего заработают победители Data Fusion Contest 2026 — ежегодного соревнования по машинному обучению!
Организаторы соревнования — ИТ-холдинг Т1 и ВТБ.
В этом году участникам предстоит выполнить три задачи:
Data Fusion Contest 2026:
Ну что, хватит читать — пора действовать
Информация о рекламодателе
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
Anthropic создала монстра: как самая безопасная компания выпустила самую безрассудную модель
В этой короткой статье вы узнаете и о реальной опасности, которой подвергают нас эти новые, мощные ИИ, и о вполне обыденном, не-фантастическом объяснении того, почему ИИ лгут, шантажируют или действуют безрассудно — всё простыми словами, чтобы вы поняли.
Читать | DATApedia
В этой короткой статье вы узнаете и о реальной опасности, которой подвергают нас эти новые, мощные ИИ, и о вполне обыденном, не-фантастическом объяснении того, почему ИИ лгут, шантажируют или действуют безрассудно — всё простыми словами, чтобы вы поняли.
Читать | DATApedia