🤖 StreamVLN — новый подход к Vision-Language Navigation
github.com/InternRobotics/StreamVLN
Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.
Что делает StreamVLN интересным:
🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов
📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.
Репозиторий: github.com/InternRobotics/StreamVLN
github.com/InternRobotics/StreamVLN
Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.
Что делает StreamVLN интересным:
🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов
📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.
Репозиторий: github.com/InternRobotics/StreamVLN
❤1
Скидки до 50% от Cloud.ru на аренду ВМ с GPU 😎
В декабре праздник на улице DS-инженеров, проектировщиков, 3D-художников и монтажеров: виртуальные машины с графическими ускорителями становятся доступнее.
Акция будет длиться до 31 декабря 2025. Не упустите шанс войти в новый год с мощными ресурсами!
Подробности акции⬅️
В декабре праздник на улице DS-инженеров, проектировщиков, 3D-художников и монтажеров: виртуальные машины с графическими ускорителями становятся доступнее.
Вот как забрать максимум выгоды:1️⃣ Взять промокод:😶🌫️ A100 — скидка 30%, код: EVOLUTIONGPUA1040GB😶🌫️ V100 — скидка 50%, код: EVOLUTIONGPUV1002️⃣ Перейти в личный кабинет3️⃣ Ввести код и обучать ML-модели, работать с тяжелой графикой, 3D-моделированием или рендерингом, но уже дешевле.
Акция будет длиться до 31 декабря 2025. Не упустите шанс войти в новый год с мощными ресурсами!
Подробности акции
Please open Telegram to view this post
VIEW IN TELEGRAM
🎨 Создание изображений с LongCat-Image
LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.
🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков
📌 GitHub: https://github.com/meituan-longcat/LongCat-Image
#python
LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.
🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков
📌 GitHub: https://github.com/meituan-longcat/LongCat-Image
#python
👍3🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Ты знаешь, как управлять AI-сценариями. Мы знаем, как поддержать эксперта ⚡️
Наша команда создаёт цифровую платформу, где ИИ – не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся!
Что будешь делать:
✔️ формировать структуры (Goal → Journey → Actions) и проектировать сценарии для различных интерфейсов
✔️ формировать high-level требования к фронтенду, API и данным
✔️ руководить полным циклом развития сценария – от идеи и прототипа до MVP, масштабирования и финансового эффекта.
Мы предлагаем: годовую премию, ДМС, скидку на ипотеку, обучение за счёт компании, современную технику и всё для комфорта и профессионального роста.
Откликайся на вакансию по ссылке
Наша команда создаёт цифровую платформу, где ИИ – не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся!
Что будешь делать:
✔️ формировать структуры (Goal → Journey → Actions) и проектировать сценарии для различных интерфейсов
✔️ формировать high-level требования к фронтенду, API и данным
✔️ руководить полным циклом развития сценария – от идеи и прототипа до MVP, масштабирования и финансового эффекта.
Мы предлагаем: годовую премию, ДМС, скидку на ипотеку, обучение за счёт компании, современную технику и всё для комфорта и профессионального роста.
Откликайся на вакансию по ссылке
🔥3❤2
⚡️ Google DeepMind представила FACTS Benchmark - новый набор тестов для оценки фактической точности LLM.
Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста
- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.
Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.
https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста
- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.
Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.
https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
❤3
Картина рынка за последние два года изменилась радикально.
Главные цифры:
- Anthropic теперь получает около 40% всех корпоративных расходов на LLM. Для сравнения: 24% год назад и всего 12% в 2023
- OpenAI за тот же период потеряла почти половину доли - с 50% в 2023 до 27% сейчас
- Google растет быстрее всех: с 7% в 2023 до 21% в 2025
Что происходит на самом деле:
- Корпоративные клиенты массово перераспределяют бюджеты в пользу Anthropic и Google
- OpenAI теряет доминирование, которое казалось недосягаемым еще два года назад
- Рынок быстро консолидируется: Anthropic, OpenAI и Google вместе занимают 88% корпоративного использования LLM API
Корпоративный ИИ перешел из фазы экспериментов в фазу прагматичного выбора. Побеждают не самые громкие модели, а те, кто дает стабильность, безопасность и предсказуемое качество на больших масштабах.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👎1
Деловое издание отметило ключевую роль Хуанга в трансформации полупроводниковой индустрии и глобальном распространении ИИ. NVIDIA оказалась в центре беспрецедентной инвестиционной программы частного сектора, что позволило ей первой в мире преодолеть рубеж рыночной капитализации в $5 трлн. и стать самой дорогой компанией на планете.
FT утверждает, что 2025 год войдет в историю как время, когда дата-центры окончательно закрепились в статусе критически важной инфраструктуры. Наращивание вычислительных мощностей для ИИ превратилась в драйвер экономики, обеспечив значительную долю роста ВВП США.
ft.com
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
🧠 Skill Seeker: Автоматизация создания Claude AI навыков
Skill Seeker позволяет быстро преобразовать любую документацию в навыки для Claude AI. Инструмент автоматически извлекает, организует и улучшает контент, создавая готовые к загрузке пакеты. Это экономит время и усилия разработчиков, позволяя им сосредоточиться на более важных задачах.
🚀Основные моменты:
- Автоматический сбор данных с любых сайтов документации
- AI-улучшение для создания качественных справочных материалов
- Поддержка множества языков программирования
- Готовые шаблоны для популярных фреймворков
- Бесплатное локальное улучшение без API-расходов
📌 GitHub: https://github.com/yusufkaraaslan/Skill_Seekers
#python
Skill Seeker позволяет быстро преобразовать любую документацию в навыки для Claude AI. Инструмент автоматически извлекает, организует и улучшает контент, создавая готовые к загрузке пакеты. Это экономит время и усилия разработчиков, позволяя им сосредоточиться на более важных задачах.
🚀Основные моменты:
- Автоматический сбор данных с любых сайтов документации
- AI-улучшение для создания качественных справочных материалов
- Поддержка множества языков программирования
- Готовые шаблоны для популярных фреймворков
- Бесплатное локальное улучшение без API-расходов
📌 GitHub: https://github.com/yusufkaraaslan/Skill_Seekers
#python
❤6🔥2
🚀 Безкодовое будущее с LLM!
Nokode — это веб-сервер без приложения, который использует LLM для обработки запросов. Он демонстрирует, как можно создать CRUD-приложение без написания кода, полагаясь на AI для генерации SQL, HTML и обработки пользовательских отзывов. Несмотря на высокую стоимость и медлительность, проект показывает потенциал AI в управлении логикой приложений.
🚀Основные моменты:
- Полностью безкодовая архитектура.
- Использует LLM для генерации ответов на HTTP-запросы.
- Реализует базовые CRUD-функции.
- Высокая стоимость и медлительность обработки запросов.
- Потенциал для будущих улучшений в производительности.
📌 GitHub: https://github.com/samrolken/nokode
#javanoscript
Nokode — это веб-сервер без приложения, который использует LLM для обработки запросов. Он демонстрирует, как можно создать CRUD-приложение без написания кода, полагаясь на AI для генерации SQL, HTML и обработки пользовательских отзывов. Несмотря на высокую стоимость и медлительность, проект показывает потенциал AI в управлении логикой приложений.
🚀Основные моменты:
- Полностью безкодовая архитектура.
- Использует LLM для генерации ответов на HTTP-запросы.
- Реализует базовые CRUD-функции.
- Высокая стоимость и медлительность обработки запросов.
- Потенциал для будущих улучшений в производительности.
📌 GitHub: https://github.com/samrolken/nokode
#javanoscript
GitHub
GitHub - samrolken/nokode
Contribute to samrolken/nokode development by creating an account on GitHub.
❤2🥱2👍1🤨1
👀 Занимательный подкаст про то, как устроено настоящее образование в ML — и почему оно начинается не с изучения нейросетей, а с матанализа.
Руководитель Школы анализа данных Яндекса Алексей Толстиков в Machine Learning Podcast рассказал, зачем сильным ИИ-специалистам нужен мощный математический фундамент, как в образовании сочетать теорию с актуальными задачами из индустрии и почему топовые специалисты преподают в ШАДе не только ради денег. А ещё он ответил на актуальные вопросы: действительно ли LLM заменят живого ментора и нужно ли отказаться от лекций в пользу практики.
Слушать и ловить образовательные инсайты тут
@bigdatai
Руководитель Школы анализа данных Яндекса Алексей Толстиков в Machine Learning Podcast рассказал, зачем сильным ИИ-специалистам нужен мощный математический фундамент, как в образовании сочетать теорию с актуальными задачами из индустрии и почему топовые специалисты преподают в ШАДе не только ради денег. А ещё он ответил на актуальные вопросы: действительно ли LLM заменят живого ментора и нужно ли отказаться от лекций в пользу практики.
Слушать и ловить образовательные инсайты тут
@bigdatai
❤5🔥1
🚀 4D Видео Представление с Trace Anything
Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.
🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.
📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything
#python
Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.
🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.
📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything
#python
👍4❤1🥰1