Data Science – Telegram
Data Science
41.2K subscribers
1.65K photos
4 videos
47 files
2.05K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
THE DRAGON HATCHLING: THE MISSING LINK
BETWEEN THE TRANSFORMER AND MODELS OF THE BRAIN


📕Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Sequential Diffusion Language Models

📕Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Sora 2 Prompting Guide

📕Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Gaussian Embeddings: How JEPAs Secretly Learn Your Data Density


📕Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
1,001 real-world gen AI use cases from the world's leading organizations

📚 Github

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models

Read

@datascienceiot
5-phase path every ML systems engineer follows but almost no one talks about.

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A comprehensive, hands-on tutorial on the most recent advancements in robotics

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Claude and your productivity platforms

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Claude Cookbooks

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Are Large Language Models Sensitive to the Motives Behind Communication?

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Scaling Large MoE Models with Wide Expert Parallelism on NVL72 Rack Scale Systems

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A-Vibe и A-Vision — собственные языковые модели технологической платформы Авито — стали доступны всем.

Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.

Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.

A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking

Read

@datascienceiot
Does Model Size Matter? A Comparison of Small and LLMs for Requirements Classification

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 От скалярного произведения к бустингу: RecSys кейс из Яндекс Лавки

Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.

Что внутри интересного для DS/ML-специалиста:

🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».

Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.

👉 Прочитать статью можно здесь