Big Data AI – Telegram
Big Data AI
17.1K subscribers
950 photos
121 videos
19 files
955 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Forwarded from Machinelearning
📌NVIDIA на NeurIPS 2025.

NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до 7 декабря в Сан-Диего.

🟡Автономный транспорт.

NVIDIA DRIVE Alpamayo-R1, или сокращенно AR1.
Это первая в мире открытая ризонинг-VLA модель специально для исследований в области автопилотов. Модель построена на базе NVIDIA Cosmos Reason и отлично поддается дообучению с помощью RL.

Alpamayo-R1 будет доступна на GitHub и Hugging Face, а фреймворк AlpaSim для тестов уже опубликован.

🟡Инструменты для создания физических роботов и симуляций.

Cosmos Cookbook - руководство с рецептами для физического ИИ и генерации синтетических данных и оценки моделей.

LidarGen - "модель мира", которая генерирует данные лидаров для симуляций.

Omniverse NuRec Fixer - инструмент мгновенного исправления артефактов в нейронных реконструкциях а робототехнике и БПЛА.

ProtoMotions3 - открытый фреймворк на базе Isaac Lab, позволяющий тренировать цифровых людей с невероятно реалистичной физикой.

🟡Но не только железом и роботами живет NVIDIA.

MultiTalker Parakeet - модель для ASR нескольких спикеров даже в быстром темпе и с перекрытиями.

В паре с ней идет Sortformer - инструмент для диаризации, т. е. разделения спикеров в аудиопотоке в реальном времени.

Ну и, конечно, NeMo Gym - библиотека для создания сред обучения с RL в комплекте с NeMo Data Designer, комплексом для создания и проверки синтетических наборов данных.

🟡И, наконец, о чистой науке.

К конференции NVIDIA подготовила более 70 научных работ. Вот лишь несколько жемчужин из этого списка:

Audio Flamingo 3. Это большая аудио-языковая модель, которая может "понимать" и анализировать аудиозаписи длительностью до 10 минут.

Minitron-SSM. Техника прунинга, которая позволила уменьшить модель Nemotron-H 8B с 8 до 4 млрд. параметров, при этом удвоив скорость инференса.

ProRL, или Prolonged Reinforcement Learning. Концепция, которая доказала, что продление процесса RL выводит модели на совершенно новый уровень в ризонинге.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
⚡️ OpenAI вводит «code red»: новый reasoning-модель уже на следующей неделе

OpenAI объявила внутренний «code red» - компания временно перераспределяет людей и мощности, чтобы сфокусироваться на усилении ChatGPT на фоне растущей конкуренции со стороны Google и других игроков.

Главное:

• Новый reasoning-модель выходит уже на следующей неделе — по внутренним тестам она обгоняет Google Gemini 3 и станет основой для Thinking Mode и Deep Research.
• Приоритет — качество продукта, а не монетизация: рекламные пилоты (включая шопинг-рекламу) продолжаются, но масштабный запуск отложен, пока команда улучшает персонализацию и UX для аудитории в 800+ млн пользователей в неделю.
• В рамках «code red» OpenAI усиливает персонализацию, ускоряет ответы, снижает число ненужных отказов и улучшает поведение моделей, чтобы повысить позиции ChatGPT в лидербордах вроде LMArena.
• Отдельный фокус — генерация изображений: после сильного релиза Google Nano Banana Pro OpenAI хочет удержать конкурентоспособность Imagegen в творческих и коммерческих сценариях.
• Стратегические ставки огромны: ChatGPT обслуживает ~70% глобальной «assistant-активности» и около 10% поиска. OpenAI рассчитывает удвоить выручку ($10B → $20B → ~$35B к 2027 году) и привлечь около $100B инвестиций на фоне давления со стороны Google и Anthropic.

Неделя обещает быть жаркой - впереди один из самых важных релизов OpenAI за год.

https://www.theinformation.com/articles/openai-ceo-declares-code-red-combat-threats-chatgpt-delays-ads-effort
2
This media is not supported in your browser
VIEW IN TELEGRAM
📊 Terminal Excel Viewer for Fast Data Management 🚀

Vex TUI - это мощный терминальный интерфейс для просмотра Excel и CSV файлов. Он предлагает шесть стильных тем, удобную навигацию с поддержкой Vim и множество функций для работы с данными, включая визуализацию и экспорт. Идеально подходит для тех, кто предпочитает работать в терминале.

🚀Основные моменты:
- Поддержка Excel и CSV файлов
- Шесть красивых тем оформления
- Визуализация данных с графиками
- Удобные клавиатурные сокращения
- Оптимизация для работы с большими файлами

📌 GitHub: https://github.com/CodeOne45/vex-tui
3
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI придумала, как заставить модель сообщать о своих галлюцинациях.

OpenAI опубликовала исследование новой техники Confessions. Метод решает проблему, когда модели пытаются обмануть систему оценки^ используют reward hacking или выдают уверенные, но ложные факты ради получения высокого балла.

Суть - в генерации вторичного ответа. После выдачи результата модель формирует отдельный отчет, где анализирует свое поведение на предмет соответствия инструкциям и получает награду за точное описание своих ошибок, даже если в основном ответе она соврала или нарушила правила.

Тесты на GPT-5 Thinkin показали пригодность Confessions: вероятность того, что ИИ нарушит правила и скроет это, упала до 4,4%. Важно понимать, что метод не предотвращает галлюцинации, а служит диагностическим инструментом.
openai.com

✔️ Amazon представила семейство моделей Nova и инструменты для создания ИИ-агентов.

Amazon запустил новую линейку из 4 моделей Nova. В нее вошли версии Lite и Pro, ориентированные на ризонинг, речевая модель Sonic и мультимодальная Omni, работающая одновременно с текстом, изображениями и видео. Все новые сервисы интегрированы в инфраструктуру AWS. Также был представлен сервис Nova Forge, позволяющий компаниям создавать кастомные версии моделей на собственных данных.

Кроме того, анонсирован инструмент Nova Act для создания агентов, автоматизирующих действия в браузере. Nova Act поддерживает архитектуру Human-in-the-Loop для передачи сложных задач человеку, а также предоставляет возможности для отладки: полные логи и записи сессий можно сохранять напрямую в Amazon S3.
aboutamazon.com

✔️ Выходцы из Tesla, Google и Nvidia запустили стартап UMA.

Новая компания Universal Mechanical Assistant (UMA) официально объявила о выходе на рынок. Она будет делать роботов для выполнения реальной физической работы в промышленных масштабах .

В инженерный костяк вошли Реми Каден (разработчик Tesla Autopilot и фреймворка LeRobot), Пьер Сермане (ветеран исследований в DeepMind), а также Роберт Найт, создатель робота SO-100.

UMA уже разрабатывает 2 аппаратные платформы: мобильного промышленного робота с двумя манипуляторами для складов и компактного гуманоида для работы в больницах и жилых помещениях. Стартап заручился поддержкой Яна Лекуна и Томаса Вольфа.
businesswire.com

✔️ KlingAI обновила видеогенератор до версии 2.6.

Новая модель поддерживает режим audio-video co-generation. Она генерирует видеоряд одновременно со звуковым сопровождением в рамках единого процесса. Система умеет создавать диалоги между несколькими персонажами, музыкальные клипы и сложные звуковые сцены (ASMR или экшен) с высокой точностью липсинка.

Есть технические ограничения: генерация голоса поддерживается только на английском и китайском языках (запросы на других языках автоматически переводятся в английский). В режиме Image-to-Video качество финального ролика теперь еще сильнее зависит от разрешения исходного изображения.
klingai.com

✔️ Opera интегрировала Gemini в десктопные браузеры One и GX.

Поддержка Gemini тестировалась исключительно в экспериментальной ветке Opera Neon, а теперь стала доступной в Opera One и геймерском Opera GX. Интеграция реализована через боковую панель.

Ассистент получил доступ к контексту браузера: он может анализировать содержимое активных веб-страниц, групп вкладок и видео, выполняя по запросу саммари или сравнительный анализ контента. Заявлена полноценная мультимодальность: движок обрабатывает не только текст, но и голосовые команды, изображения и загруженные файлы.

Техническая часть тоже изменилась. Разработчики перенесли в основные браузеры новую архитектуру с агентным подходом, изначально обкатанную в Neon. Это позволило увеличить скорость генерации ответов на 20%.
prnewswire.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🚀 Tavily Deep Research: как работает новый поисковый движок Hugging Face

Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.

🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»

🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета

Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный

Это подход «не просто найти информацию, а переварить и подать её как исследователь».

https://huggingface.co/blog/Tavily/tavily-deep-research
6👍2
✔️ По данным The Verge, OpenAI готовит ускоренный релиз GPT 5.2 уже на следующей неделе - в ответ на запуск Google Gemini 3.

Главная цель обновления - сократить отставание и усилить ChatGPT за счёт:
• более быстрых и надёжных рассуждений
• меньших задержек ответа
• лучшей управляемости через инструкции и профили

Ожидаются улучшения в скорости отклика, снижении ошибок при вызове инструментов и более предсказуемом поведении модели — то есть в тех аспектах, которые пользователи ощущают ежедневно.

📌 Источник: theverge.com/report/838857/openai-gpt-5-2-release-date-code-red-google-response
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍1
🔥 Хватит смотреть, как другие запускают AI-сервисы и зарабатывают.

На Stepik вышел курс, который учит не “писать Python-скрипты”, а строить готовые продукты с ИИ, которые работают сами.

Ты не читаешь лекции ради лекций —
ты собираешь приложение, которое генерирует текст, хранит данные, отвечает людям и запускается по расписанию.

🚀 Через несколько модулей у тебя уже есть API.
📩 Дальше — свой Telegram-бот.
🤖 Потом — сервис, который делает всё сам.

Это не теория.
Это навык, который сейчас покупают компании — разработчик, который умеет строить AI-сервисы, а не бегает с ноутом по митапам.

А теперь главное 👇
🎁 48 часов — скидка 40%. Потом цена вырастет.

Начни учиться, если ты реально хочешь войти в AI-разработку.
2🔥2🥰1
DeepSeek V3.2 сейчас лучшая open source-модель на Cortex-AGI: 38.2%.

Лидером остается Gemini 3.0 Pro с 45.6%.

Что такое Cortex-AGI?
- Это бенчмарк на абстрактное рассуждение и логику.
- Задачи процедурно генерируются, разбиты на 10 уровней сложности.
- Нельзя опереться на запоминание данных, модель должна реально рассуждать.
- Платформа сравнивает проприетарные модели и open source решения в одном строгом тесте.

Open source уже приближается к закрытым решениям по способности к логическому выводу. DeepSeek сокращает разрыв, а Gemini удерживает лидерство.
11👍2🔥1
📉 Производительность и зарплаты давно разошлись - и ИИ, вероятно, только расширит этот разрыв.

До примерно 1970-х рост выпуска на работника и рост оплаты труда двигались вместе.

После производительность продолжила резко расти, а почасовая компенсация застыла. Это почти наверняка означает, что добавленная стоимость начала уходить владельцам капитала, а не обычным работникам.

ИИ усиливает тенденцию: он повышает эффективность, но выгоды могут закрепляться у тех, кто владеет технологиями и инфраструктурой, а не у тех, кто их использует.
👎5👍3🌚2😭21
У компаний тонны данных, но ИИ даёт сбой: модели ошибаются, а аналитики тонут в информации💔

Причина в том, что ИИ не может работать с "грязными" и разрозненными данными. Недостаточно просто собрать информацию – нужно наладить ее бесперебойную поставку.

Решение: внедрить Digital Q.DataFactory от Диасофт, потом запустить ИИ.

Как работает связка Digital Q.DataFactory + ИИ:
🔹 Прогнозирование спроса: ритейлеры знают, сколько товара закупить.
🔹 Персонализация: клиенты получают предложения, которые им интересны.
🔹 Борьба с мошенничеством: ИИ мгновенно обнаруживает подозрительные операции.
🔹 Автоматизация документооборота: ИИ читает и проверяет документы без участия человека.

Компании, которые уже развернули у себя Digital Q.DataFactory, внедряют интеллектуальные сервисы в 3️⃣ раза быстрее и с предсказуемым результатом.

💡 Вывод: нужна реальная отдача от ИИ? Начните с правильного data-фундамента.

Реклама. ООО "ДИАСОФТ ЭКОСИСТЕМА". ИНН 9715403607.
✔️ Anthropic выложила датасет из 1250 диалогов.

Проект Anthropic Interviewer - инструмент для автоматизации социологических исследований. Он позволяет проводить глубокие интервью в промышленных масштабах, делегируя роль интервьюера ИИ.

Компания опубликовала результаты первого масштабного эксперимента: массив из 1250 транскриптов бесед. В выборку попали представители массовых профессий, ученые и работники креативных индустрий. ИИ выяснял, как специалисты реально интегрируют нейросети в свои рабочие процессы и как оценивают карьерные риски. Датасет доступен на HuggingFace под лицензией CC-BY.
anthropic.com
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
16 декабря пройдёт третья конференция Arch.Conf by Sber, где мы говорим об ИТ-архитектуре вместе с большим сообществом.

Вас ждёт keynote-доклад от топ-менеджеров Сбера, 2 стрима, 10 докладов от лидеров отрасли, дискуссии и детальный разбор актуальных вопросов.

▪️ «Архитектура AI-native» — обсудим паттерны построения мультиагентных систем, технологии построения агентов, подходы к работе с эмпатией и борьбу с галлюцинациями агентов.
▪️ «Архитектура — двигатель бизнеса» — поговорим о конкретных архитектурных практиках, которые позволяют откликаться на вызовы рынка быстрее всех.

Участвовать — проще простого:
✔️ Выбрать удобный формат.
✔️ Зарегистрироваться по ссылке!
1🔥1
🤖 StreamVLN — новый подход к Vision-Language Navigation
github.com/InternRobotics/StreamVLN

Модель генерирует действия по непрерывному видеопотоку в режиме online, ведя многоходовой диалог.
Базируется на LLaVA-Video, но расширена для совместного моделирования зрения, языка и действий.

Что делает StreamVLN интересным:

🔹 Принимает видеопоток → отвечает действиями и репликами в реальном времени
🔹 Обрабатывает длинные последовательности без перегрузки вычислений
🔹 Имеет два уровня памяти:
1) быстрая диалоговая память — sliding-window KV cache
2) медленная долговременная память — token pruning для экономии ресурсов

📌 Итог — агент, который может смотреть, понимать и действовать онлайн, сохраняя контекст без потерь скорости.

Репозиторий: github.com/InternRobotics/StreamVLN
1
Скидки до 50% от Cloud.ru на аренду ВМ с GPU 😎

В декабре праздник на улице DS-инженеров, проектировщиков, 3D-художников и монтажеров: виртуальные машины с графическими ускорителями становятся доступнее.

Вот как забрать максимум выгоды:

1️⃣ Взять промокод:

😶‍🌫️A100 — скидка 30%, код: EVOLUTIONGPUA1040GB
😶‍🌫️V100 — скидка 50%, код: EVOLUTIONGPUV100

2️⃣ Перейти в личный кабинет

3️⃣ Ввести код и обучать ML-модели, работать с тяжелой графикой, 3D-моделированием или рендерингом, но уже дешевле.


Акция будет длиться до 31 декабря 2025. Не упустите шанс войти в новый год с мощными ресурсами!

Подробности акции ⬅️
Please open Telegram to view this post
VIEW IN TELEGRAM
🎨 Создание изображений с LongCat-Image

LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.

🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков

📌 GitHub: https://github.com/meituan-longcat/LongCat-Image

#python
👍3🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
Ты знаешь, как управлять AI-сценариями. Мы знаем, как поддержать эксперта ⚡️

Наша команда создаёт цифровую платформу, где ИИ – не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся!

Что будешь делать:
✔️ формировать структуры (Goal → Journey → Actions) и проектировать сценарии для различных интерфейсов
✔️ формировать high-level требования к фронтенду, API и данным
✔️ руководить полным циклом развития сценария – от идеи и прототипа до MVP, масштабирования и финансового эффекта.

Мы предлагаем: годовую премию, ДМС, скидку на ипотеку, обучение за счёт компании, современную технику и всё для комфорта и профессионального роста.

Откликайся на вакансию по ссылке
2🔥2
⚡️ Google DeepMind представила FACTS Benchmark - новый набор тестов для оценки фактической точности LLM.

Коротко:
- DeepMind и Kaggle запустили FACTS Benchmark Suite для системного измерения фактической точности моделей в разных режимах.
- В набор входят 4 направления:
• Parametric - проверка внутреннего знания модели
• Search - ответы с использованием веб-поиска
• Multimodal - вопросы на основе изображений
• Grounding v2 - ответы на основе предоставленного контекста

- Всего 3 513 примеров; часть данных скрыта и используется только для официальной оценки и лидерборда.
- Топовые модели прошли тестирование: Gemini 3 Pro показывает лучший общий результат - 68.8% FACTS Score, значительно опередив Gemini 2.5 Pro, особенно в задачах Search и Parametric.
- Самой сложной областью остаётся мультимодальная фактуальность - ни одна модель не превысила порог в 70%, что показывает, насколько далеко ещё можно улучшать точность.

Новый бенчмарк даёт более реалистичную картину того, как модели справляются с фактами в разных режимах и насколько они надёжны в реальном использовании.

https://deepmind.google/blog/facts-benchmark-suite-systematically-evaluating-the-factuality-of-large-language-models
3
⚡️ Корпоративный рынок LLM: Anthropic выходит в лидеры

Картина рынка за последние два года изменилась радикально.

Главные цифры:
- Anthropic теперь получает около 40% всех корпоративных расходов на LLM. Для сравнения: 24% год назад и всего 12% в 2023
- OpenAI за тот же период потеряла почти половину доли - с 50% в 2023 до 27% сейчас
- Google растет быстрее всех: с 7% в 2023 до 21% в 2025

Что происходит на самом деле:
- Корпоративные клиенты массово перераспределяют бюджеты в пользу Anthropic и Google
- OpenAI теряет доминирование, которое казалось недосягаемым еще два года назад
- Рынок быстро консолидируется: Anthropic, OpenAI и Google вместе занимают 88% корпоративного использования LLM API

Корпоративный ИИ перешел из фазы экспериментов в фазу прагматичного выбора. Побеждают не самые громкие модели, а те, кто дает стабильность, безопасность и предсказуемое качество на больших масштабах.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
✔️ Financial Times назвала Дженсена Хуанга «Человеком года».

Деловое издание отметило ключевую роль Хуанга в трансформации полупроводниковой индустрии и глобальном распространении ИИ. NVIDIA оказалась в центре беспрецедентной инвестиционной программы частного сектора, что позволило ей первой в мире преодолеть рубеж рыночной капитализации в $5 трлн. и стать самой дорогой компанией на планете.

FT утверждает, что 2025 год войдет в историю как время, когда дата-центры окончательно закрепились в статусе критически важной инфраструктуры. Наращивание вычислительных мощностей для ИИ превратилась в драйвер экономики, обеспечив значительную долю роста ВВП США.
ft.com
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1🔥1