Data Science by ODS.ai 🦜 – Telegram
Data Science by ODS.ai 🦜
44.6K subscribers
823 photos
89 videos
7 files
1.89K links
First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev
Download Telegram
🌸 Хочешь устроиться в Яндекс за один уикенд?

Открыта регистрация на Weekend Offer ML — быстрый наймовый ивент Яндекса.

Пройди все этапы отбора за выходные и получи офер в одну из R&D‑команд: Alice AI LLM (YandexGPT), Яндекс Переводчика, Технологий компьютерного зрения, Голосового ввода, Синтеза речи и Яндекс Клавиатуры.
Кого мы ждём:
➡️ инфраструктурных и DL‑инженеров с опытом в NLP, CV, ASR или TTS;
➡️ тех, кто хочет работать над прикладными R&D задачами.

Как всё устроено:
1️⃣ до 9 декабря — регистрация и встреча с рекрутером;
2️⃣ 4 декабря в 19:00 — пройдет ознакомительная встреча с ответами на вопросы;
3️⃣ 13 декабря — всего две технические секции;
4️⃣ 14 декабря — финалы и офер.

Регистрируйся до 9 декабря по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥4👍2💊1
📏Mera MULTI📏
Большой день для большого релиза!

Встречаем новую мультимодальную версию бенчмарка - MERA Multi.

В мультимодальной версии бенчмарка представлено 18 новых задач, разработанных по методологии основного бенчмарка, которые охватывают визуальное восприятие, аудиопонимание и анализ видео.

📏 MERA Multi это:

✔️Таксономия мультимодальных навыков.

✔️Обновленная универсальная система промптов.

✔️18 новых мультимодальных задач в инструктивном формате для видео, картинок и аудио.

✔️Публичные и приватные датасеты, созданные с нуля для русского языка.

✔️Открытая платформа со сквозной системой подсчёта баллов.

✔️Открытая кодовая база для оценки и тестирования.

✔️Лидерборд, охватывающий как открытые открытые модели, так и проприетарные.

📏Mera Multi
👀Habr
💻GitHub
📚Статья

@mashkka_ds

#llm #mera #ai #genai
Forwarded from ML Underhood
В Мехико жара — и это мы сейчас не о погоде, а о NeurIPS

Продолжаем рассказывать о том, что происходит на полях конференции. Руководитель группы AI-планирования робота доставки Дмитрий Быков посетил любопытный воркшоп NORA: The First Workshop on Knowledge Graphs & Agentic Systems Interplay и поделился впечатлениями.

Авторы пытались решить проблему того, что способ запоминания знаний в языковых моделях через веса далеко не самый эффективный и создаёт много галлюцинаций. И даже поиск через интернет не спасает от артефактов — особенно на сложных запросах. Например, была проблема с вопросом обо всех женщинах Нобелевских лауреатах.

Разработали конкретные онтологии и способ извлечения знаний из них (graph ql и поиск по близости эмбеддингов). В целом, для конкретных даже сложных примеров это достаточно хорошо работало.

При этом проблема получения онтологий не из структурированных данных остаётся акутальной. Авторы возлагают большие надежды на обработку с помощью LLM, но пока так не делают.

Ещё решил послушать второй доклад по схожей теме. Тут в основном всё было сосредоточено на арабском языке.

Рассказали, как собирали онтологию — по сути, обучили BERT на ner и entity linking. Имели порядка 50 возможных отношений между объектами, часть из которых могла быть достаточно похожей. В итоге так заполнили онтологию, докинули в промпт ChatGPT значения и получили прирост по метрикам.


ML Underhood
👍1
Forwarded from AI VK Hub
На ридинг-группе 4 декабря обсудим очередную попытку разрушить классическую парадигму рекомендательных систем – фреймворк RecGPT от компании Taobao.

Китайский комбайн умеет предсказывать интент и интересы пользователя, генерировать и ранжировать айтемы-кандидаты и даже объяснять рекомендации.

Ведущим будет Александр Подвойский, ML-инженер AI VK.

🔹 4 декабря в 18:00

Zoom: ссылка
ID: 707 776 9330
Код: 464167

Параллельно запустим стрим прямо в канале AI VK Hub.

#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSeek ответил на GPT-5 и Gemini 3 Pro

Китайский стартап выпустил две новые открытые модели с мощными возможностями рассуждения — DeepSeek-V3.2 и усиленную DeepSeek-V3.2-Speciale, подтвердив, что Китай играет на равных с американскими лидерами.

По тестам разработчиков, модели достигают уровня GPT-5 и Gemini 3 Pro в программировании и математике.

Мой Компьютер
👍5😢1
Вместе с ростом цен на память грядёт и подорожание SSD. Операторы ИИ-инфраструктуры своими заказами создали дефицит флеш-памяти: за ноябрь контрактные цены чипов TLC NAND подскочили на 20-60%, а спотовые цены — на 50-80%

Мой Компьютер
🤯3🔥1🙏1
Forwarded from Russian OSINT
🈁🤖 ИИ-агенты доказали возможность автономных атак на смарт-контракты, «заработав» $4.6 млн в симуляции

Исследователи Anthropic представили отчет об успешной эксплуатации уязвимостей смарт-контрактов моделями Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 в симулированной блокчейн-среде.

В ходе тестирования на специализированном бенчмарке SCONE-bench передовые ИИ-агенты продемонстрировали способность разрабатывать эксплойты для уязвимостей, реально эксплуатировались в период с 2020 по 2025 год..

1️⃣ В рамках симуляции атаки на 2849 недавно развернутых смарт-контрактах ИИ-сервисы обнаружили две ранее неизвестные уязвимости нулевого дня (0-day).

2️⃣ Автономная эксплуатация может быть рентабельной в реальных условиях: в экспериментах затраты на запуск ИИ-агентов в размере $3 476 были компенсированы разработанными ими в симулированной среде эксплойтами на сумму $3 694.

Для контрактов, которые были взломаны после марта 2025 года, модели Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 в условиях симуляции разработали эксплойты, совокупная смоделированная стоимость которых составила $4.6 млн.

— пишут исследователи.

Авторы исследования приходят к выводу, что “прибыльная автономная эксплуатация в реальном мире технически осуществима” и подчёркивают необходимость проактивного внедрения ИИ-решений для защиты цифровых активов.

🤖❗️Эксперимент подтверждает стремительный рост наступательных кибервозможностей ИИ-агентов.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🎉1
коллеги, хочу поделиться радостной новостью, нашу статью приняли на NeurIPS; точнее приняли ее уже с месяц назад, а сейчас мы решили про это рассказать - написали статью на Хабр

я в этой статье мало что делал, в основном вкладывались коллеги в первой половине списка авторов; суть статьи довольно простая - мы можем заменить некоторые трансформерные слои в LLM на линейные преобразования (первая картинка); это экономит память и время, а качество страдает несильно (вторая картинка)

подробности по ссылкам выше; кстати, выложили код

@valuableai
10👍3🔥1
Forwarded from Russian OSINT
❗️Пользователь: «Сегодня утром я скачал 🤖Antigravity и запустил его для отладки, а он удалил весь код!!!»

Как известно, Google недавно представила Antigravity как агентную платформу нового поколения на базе Gemini 3 с возможностью автономного выполнения задач в терминале и браузере.

Один из пользователей платформы Google Antigravity столкнулся с потерей данных после предоставления 🤖ИИ-агенту автономного доступа к командной строке Windows [1,2,3]. Инцидент привел к полной очистке раздела 💽жесткого диска из-за некорректной обработки пробелов в путях файлов. Была выполнена команда rmdir /s /q d:\ вместо удаления конкретной директории, которая уничтожила содержимое диска без возможности восстановления через корзину.

В ходе отладки ИИ-агент инициировал команду очистки директории node_modules, расположенной по пути с пробелами D:\ETSY 2025\Antigravity Projects.... Из-за отсутствия кавычек в сгенерированной команде интерпретатор Windows CMD воспринял аргумент как D:, отбросив остальную часть пути после первого пробела.

🧹 Команда rmdir /s /q d:\ рекурсивно удалила всё содержимое диска, минуя корзину.


Ситуация также подтверждается отчетами других пострадавших, включая пользователя norfy2021, у которого ИИ-агент сломал операционную систему, удалив Windows Explorer и загрузочные файлы на диске C.

Эксперты связывают сбой с использованием режима 🚤 Turbo (режим автовыполнения команд терминала) и отсутствием механизмов валидации синтаксиса в больших языковых моделях при работе с файловой системой. Пострадавший под псевдонимом Tassos M сообщил о получении извинений от ИИ-сервиса.

👆Представитель Google в комментарии изданию The Register ограничился заявлением о том, что компания «серьезно относится к этим вопросам» и «активно расследует то, с чем столкнулся этот разработчик».

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8🔥31🌚1
🔭 Вышло огромное исследование на 303 страницы от ведущих китайских лабораторий — подробный разбор того, как создают и обучают модели, ориентированные на написание кода, и как на их основе строят полноценные софт-агенты.

Вот что в нём разбирается:

1. Как формируют модель
- Сбор и очистка гигантских датасетов кода.
- Предобучение: модель впитывает реальные паттерны программирования в промышленных масштабах.
- SFT и RL: дополнительные этапы, где модель учат лучше следовать инструкциям, проходить тесты и избегать очевидных ошибок.

2. Как модели превращают в инженерных агентов
- Агент читает баг-репорт или фичу.
- Планирует шаги.
- Меняет файлы.
- Запускает тесты.
- Повторяет цикл, пока не добьётся результата.

3. Какие проблемы всё ещё остаются
- Работа с огромными репозиториями.
- Безопасность и надёжность генерируемого кода.
- Корректная оценка качества работы агентов.
- Реальные приёмы и лайфхаки, которые используют текущие команды.

Исследование - мощный срез состояния индустрии: от датасетов и архитектур до практических инженерных пайплайнов. Это именно то, как современные LLM превращаются в «второго разработчика» в команде.

https://arxiv.org/abs/2511.18538

@data_analysis_ml
🔥5👍41🎉1