NEW BOT Телеграм, страница

Machine learning Interview

💰 OpenAI ищет новые способы монетизации - не только подписки ChatGPT

Финдир OpenAI Сара Фрайер намекнула, что компания будет менять модели заработка - на фоне растущих затрат компании.

Планы компании:
- Лицензирование моделей
OpenAI может брать долю с дохода клиентов, если продукт их“выстрелит”.
Пример: если с помощью моделей OpenAI нашли лекарство, компания получит процент от продаж.

- Больше тарифных планов
Помимо обычной подписки - развитие:
- enterprise SaaS-цен
- usage / credit-based модели (платишь за использование)

- Тестирование рекламы в ChatGPT
OpenAI готовится пробовать рекламу, но заявляет, что:
- ответы модель должны оставаться “оптимальными”, а не рекламными
- останется ad-free тариф без рекламы

OpenAI планирует будет зарабатывать не только на подписке, но и на успехе клиентов + гибких тарифах.

Наш чат / Полезные ИИ-ресурсы

#openai #ChatGPT

💊25😁10👍4😭2🔥1🌭1

2.74K views13:01

Machine learning Interview

27:45

Media is too big

VIEW IN TELEGRAM

🚀 Крупный IT-стартап на 1200 сотрудников сегодня выглядит так: стойка из десятков Mac mini, на которых круглосуточно крутится тот самый хайповый Clawdbot, про который уже отлично писали коллеги 😊

И это не шутка.

В Кремниевой долине сейчас настоящий мини-бум: разработчики, стартапы и даже целые команды массово скупают Mac mini, чтобы поднимать на них этого «опенсорсного Джарвиса».
Доходит до абсурда — в ряде магазинов «миники» начали уходить в дефицит именно из-за AI-инфраструктуры под локальные агенты.

Почему так происходит?

Потому что это уже не просто бот.
Clawdbot — это по сути цифровой сотрудник:
- пишет код
- помогает с инфраструктурой
- отвечает в рабочих чатах
- автоматизирует рутину
- подключён к инструментам

И всё это - self-hosted, под полным контролем команды.

Так что теперь штат в стартапах выглядит примерно так:

Слева направо:
Clawdbot, Clawdbot и ещё немного Clawdbot.

Людей меньше не стало.
Просто теперь каждый человек работает в паре с агентом, а производительность команды умножается, а не складывается.

Это уже не «AI как инструмент».
Это AI как часть команды.

Код Clawdbot в опенсорсе: https://github.com/clawdbot/clawdbot

@machinelearning_interview

❤8🔥5👍3😱2💊1

5.2K views08:56

Machine learning Interview

🚀 PageIndex - умный индекс документов для reasoning-RAG (без векторов)

PageIndex от VectifyAI - open-source система, которая помогает работать с длинными документами (PDF, тексты, правила и т.д.) так, как это сделал бы эксперт-человек, а не обычный поисковик.

В отличие от традиционных RAG-систем, которые разбивают текст на куски и используют vector search (векторное сопоставление), PageIndex создаёт иерархическое дерево структуры документа и позволяет моделям ИИ логически искать ответы через reasoning и tree search.

📄 Основная идея
- Длинные документы индексируются как семантическое дерево — похожее на умный «оглавление»
- Структура сохраняет контекст и древовидную иерархию секций
- При запросе модель обходит дерево через reasoning-поиск, как человек, который листает книгу по разделам, а не просто ищет по похожести текста
- Не нужны: векторная база данных, chunking и top-K-селекция, что снижает потери контекста и повышает точность поиска

🧠 Почему это важно
✔️ Лучше для сложных и больших документов (финансовые отчёты, юридические тексты, технические мануалы)
✔️ Сохранение структуры означает, что ИИ может понимать, где именно в документе находится нужная информация
✔️ В отличие от vector-RAG, здесь решение не основано на похожести, а на пошаговом анализе структуры документа

🔧 Что внутри
- Скрипты и Jupyter-ноутбуки для генерации дерева из PDF или Markdown
- Возможность делать reasoning-RAG напрямую без внешних Vector DB
- Примеры использования и cookbooks для практических сценариев

PageIndex - это не просто индекс, а иерархический, reasoning-ориентированный RAG-фреймворк. Он позволяет ИИ читать и анализировать документы, как эксперт, обходя ограничения простого векторного поиска в больших текстах.

▪ Github: https://github.com/VectifyAI/PageIndex
▪ Blog post: https://vectify.ai/blog/Mafin2.5

👍12🔥7🥰2

2.22K views13:01

Machine learning Interview

🚀 Kimi K2.5 - Open-Source Visual Agentic Intelligence

Moonshot представили Kimi K2.5 - это полноценный визуальный агент, заточенный под сложные задачи, код и мультимодальность.

Что по бенчмаркам

🔹 Глобальный SOTA на агентных тестах
- HLE full set - 50.2%
- BrowseComp - 74.9%

🔹 Open-source лидер по зрению и коду
- MMMU Pro - 78.5%
- VideoMMMU - 86.6%
- SWE-bench Verified - 76.8%

Фишка, которая выделяет K2.5

🎨 Code with Taste — модель превращает чаты, изображения и видео в эстетичные сайты с анимацией и выразительным движением, а не просто сухой HTML.

🤖 Agent Swarm (Beta)
Самонаправленные агенты, работающие параллельно:

- До 100 суб-агентов
- До 1 500 вызовов инструментов
- До 4.5x быстрее по сравнению с одиночным агентом

Это уже ближе к распределённой системе ИИ-исполнителей, чем к одному «умному боту».

Где попробовать

🥝 K2.5 доступен на http://kimi.com
- Chat mode
- Agent mode

🥝 Agent Swarm — бета для пользователей высокого уровня

🧑‍💻 Для продакшн-разработки можно связать с Kimi Code
https://kimi.com/code

Для разработчиков

🔗 API - https://platform.moonshot.ai
🔗 Тех-блог - http://kimi.com/blogs/kimi-k2-5.html
🔗 Веса и код - https://huggingface.co/moonshotai/Kimi-K2.5/tree/main

K2.5 - это шаг к мультиагентным ИИ-системам, где модель не просто отвечает, а организует работу, использует инструменты и действует в визуальной среде.

🔥6👍5❤4

1.77K views06:40

Machine learning Interview

🦾 Тестирование AI-агентов: от RAG-прототипа к управляемой системе

Красивые ответы в прототипе не означают готовность к продакшену. Галлюцинации, ложная уверенность и деградация качества проявляются при работе с реальными пользователями.

На уроке разберём:
— Архитектуру AI-агента как объект тестирования: LLM, RAG, промпты, данные.
— Ключевые ошибки: галлюцинации, нерелевантность, ложная уверенность.
— Метрики для оценки качества и цикл: тестирование → улучшение → валидация.
— Практическую демонстрацию валидации RAG-агента.

🗓 10 февраля, 20:00 МСК
Регистрация на открытый урок курса «LLM Driven Development»: https://otus.pw/5SdN/?erid=2W5zFJeYMiY

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

❤4🔥3

1.81K views07:33

Machine learning Interview

🚀🚀🚀 Tencent открыли HPC-Ops — продакшн-библиотеку операторов для LLM-инференса, выжимающую максимум из GPU

HPC-Ops — это библиотека операторов от Tencent HY, созданная для достижения пиковых показателей производительности на массовых inference-картах. Решает главную боль продакшена: стандартные библиотеки часто не доходят до реального потолка железа.

Главные плюсы

🔹 +30% к пропускной способности
- До +30% QPM для моделей Tencent HY
- +17% для DeepSeek в реальных продакшн-сценариях

🔹 Оптимизация под железо
С нуля написано на CUDA + CuTe, чтобы максимально загрузить GPU и убрать узкие места типичных стеков.

🔹 SOTA по ядрам

- Attention — до 2.22× быстрее, чем FlashInfer / FlashAttention
- GroupGEMM — до 1.88× быстрее, чем DeepGEMM
- FusedMoE — до 1.49× быстрее, чем TensorRT-LLM

🔹 Готово к продакшену

- Поддержка ключевых операторов: FusedMoE, GroupGEMM
- Многонодовая коммуникация
- Чистая абстракция для кастомизации под свои пайплайны

Библиотека уже используется в крупномасштабных инференс-сервисах Tencent.

Если вы крутите LLM в проде и упёрлись в пределы производительности — это как раз тот слой, где можно вытащить дополнительные десятки процентов без смены железа.

🔗 GitHub: https://github.com/Tencent/hpc-ops

❤7👍5🔥3👏2

2.06K views08:40

Machine learning Interview

Google Research представили ATLAS — Practical scaling laws for multilingual models 🌍📈

Это практическая методика масштабирования многоязычных моделей, которая помогает понять, как правильно сочетать размер модели, объём данных и набор языков при обучении — не только для английского, а для сотен языков сразу.

Что сделали исследователи
• Провели 774 тренировки моделей от 10M до 8B параметров
• Охватили 400+ языков
• Тестировали качество на 48 языках

ATLAS вводит адаптивные scaling laws, которые учитывают не только размер модели и данные, но и количество языков в обучении. Это важно, потому что в мультилингвистических моделях появляется эффект «curse of multilinguality» — когда слишком много языков начинают конкурировать за ограниченную ёмкость модели.

Чем это ценно на практике

— Помогает понять, когда добавление языков даёт положительный трансфер, а когда начинает вредить
— Показывает, как распределять данные между языками для лучшего качества на целевых
— Дает ориентиры, когда выгоднее обучать модель с нуля, а когда дообучать уже существующую

Также вводится кросс-языковая матрица трансфера, показывающая, какие языки усиливают друг друга, а какие — конфликтуют при совместном обучении.

По сути ATLAS — это data-driven фундамент для проектирования многоязычных LLM:
сколько параметров нужно, сколько данных давать и какие языки смешивать, чтобы получить максимум качества без лишних затрат.

Шаг в сторону более эффективного и менее англоцентричного AI.

https://research.google/blog/atlas-practical-scaling-laws-for-multilingual-models/

👍5❤2

1.55K views13:01

About

Blog

Apps

Platform