🚀 Tavily Deep Research: как работает новый поисковый движок Hugging Face
Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.
🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»
🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета
✨ Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный
Это подход «не просто найти информацию, а переварить и подать её как исследователь».
https://huggingface.co/blog/Tavily/tavily-deep-research
Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.
🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»
🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета
✨ Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный
Это подход «не просто найти информацию, а переварить и подать её как исследователь».
https://huggingface.co/blog/Tavily/tavily-deep-research
❤6👍2
Главная цель обновления - сократить отставание и усилить ChatGPT за счёт:
• более быстрых и надёжных рассуждений
• меньших задержек ответа
• лучшей управляемости через инструкции и профили
Ожидаются улучшения в скорости отклика, снижении ошибок при вызове инструментов и более предсказуемом поведении модели — то есть в тех аспектах, которые пользователи ощущают ежедневно.
📌 Источник: theverge.com/report/838857/openai-gpt-5-2-release-date-code-red-google-response
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3👍1
🔥 Хватит смотреть, как другие запускают AI-сервисы и зарабатывают.
На Stepik вышел курс, который учит не “писать Python-скрипты”, а строить готовые продукты с ИИ, которые работают сами.
Ты не читаешь лекции ради лекций —
ты собираешь приложение, которое генерирует текст, хранит данные, отвечает людям и запускается по расписанию.
🚀 Через несколько модулей у тебя уже есть API.
📩 Дальше — свой Telegram-бот.
🤖 Потом — сервис, который делает всё сам.
Это не теория.
Это навык, который сейчас покупают компании — разработчик, который умеет строить AI-сервисы, а не бегает с ноутом по митапам.
А теперь главное 👇
🎁 48 часов — скидка 40%. Потом цена вырастет.
Начни учиться, если ты реально хочешь войти в AI-разработку.
На Stepik вышел курс, который учит не “писать Python-скрипты”, а строить готовые продукты с ИИ, которые работают сами.
Ты не читаешь лекции ради лекций —
ты собираешь приложение, которое генерирует текст, хранит данные, отвечает людям и запускается по расписанию.
🚀 Через несколько модулей у тебя уже есть API.
📩 Дальше — свой Telegram-бот.
🤖 Потом — сервис, который делает всё сам.
Это не теория.
Это навык, который сейчас покупают компании — разработчик, который умеет строить AI-сервисы, а не бегает с ноутом по митапам.
А теперь главное 👇
🎁 48 часов — скидка 40%. Потом цена вырастет.
Начни учиться, если ты реально хочешь войти в AI-разработку.
❤2🔥2🥰1
DeepSeek V3.2 сейчас лучшая open source-модель на Cortex-AGI: 38.2%.
Лидером остается Gemini 3.0 Pro с 45.6%.
Что такое Cortex-AGI?
- Это бенчмарк на абстрактное рассуждение и логику.
- Задачи процедурно генерируются, разбиты на 10 уровней сложности.
- Нельзя опереться на запоминание данных, модель должна реально рассуждать.
- Платформа сравнивает проприетарные модели и open source решения в одном строгом тесте.
Open source уже приближается к закрытым решениям по способности к логическому выводу. DeepSeek сокращает разрыв, а Gemini удерживает лидерство.
Лидером остается Gemini 3.0 Pro с 45.6%.
Что такое Cortex-AGI?
- Это бенчмарк на абстрактное рассуждение и логику.
- Задачи процедурно генерируются, разбиты на 10 уровней сложности.
- Нельзя опереться на запоминание данных, модель должна реально рассуждать.
- Платформа сравнивает проприетарные модели и open source решения в одном строгом тесте.
Open source уже приближается к закрытым решениям по способности к логическому выводу. DeepSeek сокращает разрыв, а Gemini удерживает лидерство.
❤11👍2🔥1
📉 Производительность и зарплаты давно разошлись - и ИИ, вероятно, только расширит этот разрыв.
До примерно 1970-х рост выпуска на работника и рост оплаты труда двигались вместе.
После производительность продолжила резко расти, а почасовая компенсация застыла. Это почти наверняка означает, что добавленная стоимость начала уходить владельцам капитала, а не обычным работникам.
ИИ усиливает тенденцию: он повышает эффективность, но выгоды могут закрепляться у тех, кто владеет технологиями и инфраструктурой, а не у тех, кто их использует.
До примерно 1970-х рост выпуска на работника и рост оплаты труда двигались вместе.
После производительность продолжила резко расти, а почасовая компенсация застыла. Это почти наверняка означает, что добавленная стоимость начала уходить владельцам капитала, а не обычным работникам.
ИИ усиливает тенденцию: он повышает эффективность, но выгоды могут закрепляться у тех, кто владеет технологиями и инфраструктурой, а не у тех, кто их использует.
👎5👍3🌚2😭2❤1
У компаний тонны данных, но ИИ даёт сбой: модели ошибаются, а аналитики тонут в информации💔
Причина в том, что ИИ не может работать с "грязными" и разрозненными данными. Недостаточно просто собрать информацию – нужно наладить ее бесперебойную поставку.
Решение: внедрить Digital Q.DataFactory от Диасофт, потом запустить ИИ.
Как работает связка Digital Q.DataFactory + ИИ:
🔹 Прогнозирование спроса: ритейлеры знают, сколько товара закупить.
🔹 Персонализация: клиенты получают предложения, которые им интересны.
🔹 Борьба с мошенничеством: ИИ мгновенно обнаруживает подозрительные операции.
🔹 Автоматизация документооборота: ИИ читает и проверяет документы без участия человека.
Компании, которые уже развернули у себя Digital Q.DataFactory, внедряют интеллектуальные сервисы в 3️⃣ раза быстрее и с предсказуемым результатом.
💡 Вывод: нужна реальная отдача от ИИ? Начните с правильного data-фундамента.
Реклама. ООО "ДИАСОФТ ЭКОСИСТЕМА". ИНН 9715403607.
Причина в том, что ИИ не может работать с "грязными" и разрозненными данными. Недостаточно просто собрать информацию – нужно наладить ее бесперебойную поставку.
Решение: внедрить Digital Q.DataFactory от Диасофт, потом запустить ИИ.
Как работает связка Digital Q.DataFactory + ИИ:
🔹 Прогнозирование спроса: ритейлеры знают, сколько товара закупить.
🔹 Персонализация: клиенты получают предложения, которые им интересны.
🔹 Борьба с мошенничеством: ИИ мгновенно обнаруживает подозрительные операции.
🔹 Автоматизация документооборота: ИИ читает и проверяет документы без участия человека.
Компании, которые уже развернули у себя Digital Q.DataFactory, внедряют интеллектуальные сервисы в 3️⃣ раза быстрее и с предсказуемым результатом.
💡 Вывод: нужна реальная отдача от ИИ? Начните с правильного data-фундамента.
Реклама. ООО "ДИАСОФТ ЭКОСИСТЕМА". ИНН 9715403607.
Проект Anthropic Interviewer - инструмент для автоматизации социологических исследований. Он позволяет проводить глубокие интервью в промышленных масштабах, делегируя роль интервьюера ИИ.
Компания опубликовала результаты первого масштабного эксперимента: массив из 1250 транскриптов бесед. В выборку попали представители массовых профессий, ученые и работники креативных индустрий. ИИ выяснял, как специалисты реально интегрируют нейросети в свои рабочие процессы и как оценивают карьерные риски. Датасет доступен на HuggingFace под лицензией CC-BY.
anthropic.com
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Anthropic/AnthropicInterviewer · Datasets at Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
16 декабря пройдёт третья конференция Arch.Conf by Sber, где мы говорим об ИТ-архитектуре вместе с большим сообществом.
Вас ждёт keynote-доклад от топ-менеджеров Сбера, 2 стрима, 10 докладов от лидеров отрасли, дискуссии и детальный разбор актуальных вопросов.
▪️ «Архитектура AI-native» — обсудим паттерны построения мультиагентных систем, технологии построения агентов, подходы к работе с эмпатией и борьбу с галлюцинациями агентов.
▪️ «Архитектура — двигатель бизнеса» — поговорим о конкретных архитектурных практиках, которые позволяют откликаться на вызовы рынка быстрее всех.
Участвовать — проще простого:
✔️ Выбрать удобный формат.
✔️ Зарегистрироваться по ссылке!
Вас ждёт keynote-доклад от топ-менеджеров Сбера, 2 стрима, 10 докладов от лидеров отрасли, дискуссии и детальный разбор актуальных вопросов.
▪️ «Архитектура AI-native» — обсудим паттерны построения мультиагентных систем, технологии построения агентов, подходы к работе с эмпатией и борьбу с галлюцинациями агентов.
▪️ «Архитектура — двигатель бизнеса» — поговорим о конкретных архитектурных практиках, которые позволяют откликаться на вызовы рынка быстрее всех.
Участвовать — проще простого:
✔️ Выбрать удобный формат.
✔️ Зарегистрироваться по ссылке!
❤1🔥1
🤖 StreamVLN — новый подход к Vision-Language Navigation
github.com/InternRobotics/StreamVLN
Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.
Что делает StreamVLN интересным:
🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов
📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.
Репозиторий: github.com/InternRobotics/StreamVLN
github.com/InternRobotics/StreamVLN
Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.
Что делает StreamVLN интересным:
🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов
📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.
Репозиторий: github.com/InternRobotics/StreamVLN
❤1
Скидки до 50% от Cloud.ru на аренду ВМ с GPU 😎
В декабре праздник на улице DS-инженеров, проектировщиков, 3D-художников и монтажеров: виртуальные машины с графическими ускорителями становятся доступнее.
Акция будет длиться до 31 декабря 2025. Не упустите шанс войти в новый год с мощными ресурсами!
Подробности акции⬅️
В декабре праздник на улице DS-инженеров, проектировщиков, 3D-художников и монтажеров: виртуальные машины с графическими ускорителями становятся доступнее.
Вот как забрать максимум выгоды:1️⃣ Взять промокод:😶🌫️ A100 — скидка 30%, код: EVOLUTIONGPUA1040GB😶🌫️ V100 — скидка 50%, код: EVOLUTIONGPUV1002️⃣ Перейти в личный кабинет3️⃣ Ввести код и обучать ML-модели, работать с тяжелой графикой, 3D-моделированием или рендерингом, но уже дешевле.
Акция будет длиться до 31 декабря 2025. Не упустите шанс войти в новый год с мощными ресурсами!
Подробности акции
Please open Telegram to view this post
VIEW IN TELEGRAM
🎨 Создание изображений с LongCat-Image
LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.
🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков
📌 GitHub: https://github.com/meituan-longcat/LongCat-Image
#python
LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.
🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков
📌 GitHub: https://github.com/meituan-longcat/LongCat-Image
#python
👍3🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Ты знаешь, как управлять AI-сценариями. Мы знаем, как поддержать эксперта ⚡️
Наша команда создаёт цифровую платформу, где ИИ – не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся!
Что будешь делать:
✔️ формировать структуры (Goal → Journey → Actions) и проектировать сценарии для различных интерфейсов
✔️ формировать high-level требования к фронтенду, API и данным
✔️ руководить полным циклом развития сценария – от идеи и прототипа до MVP, масштабирования и финансового эффекта.
Мы предлагаем: годовую премию, ДМС, скидку на ипотеку, обучение за счёт компании, современную технику и всё для комфорта и профессионального роста.
Откликайся на вакансию по ссылке
Наша команда создаёт цифровую платформу, где ИИ – не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся!
Что будешь делать:
✔️ формировать структуры (Goal → Journey → Actions) и проектировать сценарии для различных интерфейсов
✔️ формировать high-level требования к фронтенду, API и данным
✔️ руководить полным циклом развития сценария – от идеи и прототипа до MVP, масштабирования и финансового эффекта.
Мы предлагаем: годовую премию, ДМС, скидку на ипотеку, обучение за счёт компании, современную технику и всё для комфорта и профессионального роста.
Откликайся на вакансию по ссылке
❤2🔥2
⚡️ Google DeepMind представила FACTS Benchmark - новый набор тестов для оценки фактической точности LLM.
Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста
- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.
Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.
https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста
- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.
Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.
https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
❤2