THE DRAGON HATCHLING: THE MISSING LINK
BETWEEN THE TRANSFORMER AND MODELS OF THE BRAIN
📕 Читать
@datascienceiot
BETWEEN THE TRANSFORMER AND MODELS OF THE BRAIN
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models
Read
@datascienceiot
Read
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A comprehensive, hands-on tutorial on the most recent advancements in robotics
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Scaling Large MoE Models with Wide Expert Parallelism on NVL72 Rack Scale Systems
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A-Vibe и A-Vision — собственные языковые модели технологической платформы Авито — стали доступны всем.
Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.
Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.
A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.
Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.
A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking
Read
@datascienceiot
Read
@datascienceiot
Does Model Size Matter? A Comparison of Small and LLMs for Requirements Classification
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 От скалярного произведения к бустингу: RecSys кейс из Яндекс Лавки
Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.
Что внутри интересного для DS/ML-специалиста:
🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».
Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.
👉 Прочитать статью можно здесь
Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.
Что внутри интересного для DS/ML-специалиста:
🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».
Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.
👉 Прочитать статью можно здесь