Data Science – Telegram
Data Science
41.2K subscribers
1.65K photos
4 videos
47 files
2.05K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
Запущен первый российский продуктовый бенчмарк RAG-решений: открыт прием заявок

Кейс, который важен всем, кто делает или внедряет корпоративные ИИ-решения: в России появился инструмент, позволяющий объективно сравнивать RAG-сервисы по реальным бизнес-задачам — RRNCB (Russian RAG Normative-Corporate Benchmark)

Что интересного внутри для AI/ML-команд:

🔹 Полный пайплайн: бенчмарк проверяет не только LLM, а все решение целиком — от извлечения документов до генерации ответа.

🔹 Реальные данные: тесты строятся на корпоративных сценариях — ГОСТы, договоры, регламенты.

🔹 Прозрачная методология: независимая оценка с участием экспертов и внешних LLM.

🔹 Прозрачная польза для всех участников: компании получают независимое подтверждение качества продукта и шанс попасть в первый рейтинг российских RAG-решений, а клиенты — рейтинг с понятными критериями.

К участию приглашены все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. В рамках бенчмарка ожидается испытание популярных RAG решений: Сбер (GigaChat), Яндекс (Нейроэксперт), МТС (Cotype), Softline (Преферентум), Авито, Точка Банк, Just AI и других лидеров рынка.

🗓 Прием заявок на сайте RRNCB — до 21 ноября,
результаты — 12 декабря.

👉 Читать
Introduction to Agents

📚 Read

@datascienceiot
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

AI-агенты перестали быть экспериментом — они становятся основой продуктовых решений. Вопрос лишь в том, умеете ли вы создавать своих?

С 20 ноября будет Yandex AI Studio Series — серия практических вебинаров для тех, кто хочет пройти путь от идеи до production-ready AI-агента за 7 дней.

💡Что будет на интенсиве:
🟠 4 онлайн-трансляции с сессией вопросов и ответов.
🟠Предзаписанный воркшоп для самостоятельной практики.
🟠Квиз и приятные сюрпризы.
🟠Нетворкинг в продуктовом комьюнити.
🟠Офлайн-встреча в офисе Яндекса в Москве.
Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

Участие в мероприятии бесплатное.

Если вы AI/ML-инженер или разработчик и хотите углубиться в инженеринг агентов и мультиагентных систем — присоединяйтесь.

Регистрация

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Fighting the New York Times’ invasion of user privacy

📚 Read

@datascienceiot
Understanding neural networks through sparse circuits

📚 Read

@datascienceiot
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javanoscript: t.me/javanoscriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://news.1rj.ru/str/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://news.1rj.ru/str/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://news.1rj.ru/str/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://news.1rj.ru/str/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://news.1rj.ru/str/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness

📚 Read

@datascienceiot
LiteAttention: A Temporal Sparse Attention for Diffusion Transformers

📚 Read

@datascienceiot
Gemini 3 Developer Guide

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Accelerate Large-Scale LLM Inference and KV Cache Offload with CPU-GPU Memory Sharing

📚 Read
Please open Telegram to view this post
VIEW IN TELEGRAM
Generative AI as a Linguistic Equalizer in Global Science

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
The state of AI in 2025: Agents, innovation, and transformation

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Introduction to Compilers and Language Design

📚 Book

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Модель P1 взяла золото на Международной олимпиаде по физике.

Shanghai AI Lab натренировал семейство моделей P1 для решения сложнейших физических задач. Флагманская модель P1-235B-A22B добилась исторического результата, став первой открытой моделью, которая решила задачи Международной олимпиады по физике 2025 года на уровень золотой медали.

P1 сравнялась на физическом бенче HiPhO по количеству медалей с Gemini-2.5-Pro и обошла GPT-5. Основой успеха стала мультиагентная система PhysicsMinions, которая итеративно проверяет и улучшает решения, анализируя их логику и физическую состоятельность.

Весь проект P1, включая сами модели и бенчмарки, опубликован в открытом доступе.
prime-rl.github.io

✔️ Google готовит тысячекратное увеличение ИИ-мощностей.

Техногигант планирует в 1000 раз нарастить свои вычислительные мощности для ИИ в течение следующих 4-5 лет. По словам топ-менеджеров, Google уже вынуждена удваивать серверные емкости для ИИ каждые полгода, чтобы справляться с растущей нагрузкой.

Руководство Google считает, что риск недоинвестирования в инфраструктуру сейчас выше, чем риск перерасхода средств. План расширения опирается на три элемента: более тесную интеграцию аппаратного и программного обеспечения, повышение эффективности моделей и использование кастомных чипов.
cnbc.com

✔️ В NotebookLM добавили возможность создавать презентации и инфографику.

Сервис расширили функцией генерации слайдов на основе загруженных источников. Инструмент подойдет для быстрого структурирования информации и создания черновиков презентаций или визуально улучшения уже существующих материалов.

Слайды доступны для скачивания в формате PDF, экспорт в Google Slides и PowerPoint уже находится в разработке. За работу новой функции отвечает Nano Bana Pro.

Лимиты на использование зависят от типа аккаунта пользователя.
NotebookLM в сети Х

✔️ Reality Labs Марка Цукерберга анонсировала text-to-world систему.

WorldGen — система генерации полностью интерактивных 3D-мирой на основе простых текстовых запросов. Технология использует процедурную логику и диффузионные модели для создания детализированных и стилистически выдержанных локаций размером до 50x50 метров.

Итоговые сцены WorldGen, согласно демо-роликам, не просто статичны, а готовы к навигации и взаимодействию. Созданные миры совместимы с игровыми движками Unity и Unreal и не требуют дополнительных конвертаций или сложной настройки рендеринга.

Проект находится на стадии исследования и пока недоступен для широкого использования.
roadtovr.com

✔️ Ubisoft создает ИИ-NPC для игр.

Игровая студия анонсировала экспериментальный проект Teammates, который меняет взаимодействие с неигровыми персонажами. Технология на базе генеративного ИИ позволяет NPC понимать естественную речь и действовать как участники процесса, а не просто скриптовые боты.

В рамках прототипа, созданного на основе шутера от первого лица, игроку помогают два ИИ-напарника и голосовой ассистент Джаспар. Они способны реагировать на голосовые команды: подсвечивать цели, предоставлять информацию о сюжете, изменять игровые настройки или ставить игру на паузу. Система анализирует контекст и действия игрока, обеспечивая динамическую реакцию персонажей в реальном времени.

Ubisoft говорит, что проект уже прошел закрытое тестирование. По мнению CEO компании, ИИ станет для индустрии революцией, сравнимой с переходом игр от 2D к 3D.
news.ubisoft.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышел подробный разбор на примере VK про то, как крупные рекламные платформы выстраивают ML-архитектуру:

🔹 Product ML: модели бюджетирования, прогнозирования конверсий, выбора креативов
🔹 Anti-fraud ML: бертовые энкодеры и LLM для обнаружения аномалий и сложного фрода
🔹 Discovery-платформа: фактически полный ML-пайплайн, объединяющий данные и модели для рекомендаций, поиска и рекламы.

Читать
OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe"

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Помните, как это было? Кофе, зачетка и возможность просто учиться без спринтов и задач

29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.

Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.

Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.

Регистрируйтесь по ссылке тут!
How to write a great agents.md: Lessons from over 2,500 repositories

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
На AI Journey презентовали крупнейший open-source проект в Европе: Сбер открыл доступ к своим флагманским моделям - GigaChat Ultra-Preview и Lightning, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи, все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite.

GigaChat Ultra-Preview, новая MoE-модель, 702 миллиарда параметров, собранная под русский язык и натренированная полностью с нуля. Читайте подробный пост от команды.

Впервые в России обучена MoE-модель такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение с нуля, да и ещё на таком масштабе, — это вызов, который приняли немногие команды в мире.

Флагманская модель Kandinsky Video Pro сравнялась с Veo 3 по визуальному качеству и обогнала Wan 2.2-A14B. Читайте подробный пост от команды.

Код и веса всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
This new research from Meta introduces Matrix, a peer-to-peer framework where multiple AI agents collaboratively generate synthetic training data through decentralized interactions.

📚 Read

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Ozon Profit расширил возможности по сбору и разметке данных для ML

Краудсорсинговая платформа добавила функцию выездных заданий по всей России. Это существенно расширяет инструментарий data-специалистов для работы с данными.

💡Что это значит на практике?

🟠Компании смогут нанимать исполнителей для сбора данных в поле: фотофиксация витрин, проверка цен, аудит сервиса.
🟠Исполнители выполняют разметку текстов, изображений, видео, анализ обращений клиентов и определение тональности для обучения ML-моделей.
🟠Более 40 000 активных исполнителей в сети. Доступны API-интеграции для автоматизации загрузки данных и запуска заданий.

Платформа позиционирует себя как решение для технологических проектов, маркетплейсов и стартапов, которым требуется масштабируемая обработка данных.