Media is too big
VIEW IN TELEGRAM
Google объявила о запуске экспериментальной функции Audio Overviews, которая генерирует аудио-сводки для поисковых запросов. Новинка основана на новых моделях Gemini и направлена на упрощение восприятия информации для пользователей, предпочитающих аудиоформат. Функция пока доступна в программе Labs, ее активируют автоматически, если система считает, что обзор будет полезен.
К аудио Google добавит ссылки на источники, чтобы слушатели могли углубиться в тему. Пользователи могут оценивать обзоры, отправляя обратную связь через кнопки «нравится»/«не нравится».
blog.google
ВС США создали отряд резервистов "201", куда вошли топ-менеджеры Palantir (Шьям Санкар, CTO) , Компании Марка Цукерберга (Эндрю Босворт, СТО) и OpenAI (Кевин Вейл и Боб Макгрю). Все "новобранцы" получили звания подполковников, их задача - внедрять ИИ в планирование и операции армии и ускорять трансформацию подразделений.
Эксперты будут работать удаленно, минимум 120 часов в год, не проходя базовой подготовки. Palantir уже сотрудничает с армией с 2008 года (проект Maven, $480 млн) по интеграции ИИ. IT-гигант Цукерберга, в свою очередь, связан с Anduril, поставляющей «умные» очки. OpenAI, несмотря на прошлые обещания не разрабатывать военные продукты, также участвует в партнерствах с военными.
theregister.com
Законодатели Нью-Йорка одобрили RAISE Act, направленный на предотвращение масштабных катастроф, вызванных передовыми ИИ-моделями от компаний OpenAI, Google и Anthropic. Закон требует публиковать отчеты о безопасности, сообщать об инцидентах и грозит штрафами до $30 млн. Регулирование коснется лишь крупных игроков, потративших свыше $100 млн на вычисления.
Авторы закона подчеркнули, что он не должен тормозить стартапы или научные исследования, в отличие от провалившегося законопроекта SB 1047 в Калифорнии. Однако критики, включая Andreessen Horowitz и Anthropic, утверждают: требования слишком широки и могут ударить по малым компаниям.
В настоящее время RAISE Act ждет подписи губернатора штата.
nysenate.gov
Astra — веб-сервис для улучшения качества видео, который масштабирует контент до 4K, сохраняя детали. Инструмент подойдет как для творческих экспериментов, так и для точного восстановления кадров: пользователи могут регулировать интенсивность обработки или фокусироваться на резкости.
Astra поддерживает до 120 кадров в секунду и замедление в 8 раз с плавной интерполяцией кадров. Topaz Labs позиционирует Astra как полезный инструмент для ремастеринга старых записей или улучшения медийных проектов.
Открыта запись в лист ожидания доступа к сервису.
Topaz Labs в сети X
«Image to Video» превращает статичные изображения в пятисекундные клипы. Рекламодатели загружают изображение, добавляют текстовый запрос и получают несколько вариантов видео, которые можно комбинировать в более длинные ролики.
«Text to Video» позволяет генерировать видео только на основе текста, без изображений или шаблонов. Третий инструмент, «Showcase Products», добавляет цифровые аватары, которые держат продукты, примеряют одежду или показывают приложения на смартфоне, делая рекламу более живой и похожей на пользовательский контент.
Все видео помечаются как сгенерированные ИИ и могут интегрироваться в Adobe Express и WPP Open. TikTok не раскрывает, какие именно модели используются.
newsroom.tiktok.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54❤28👍19🤣5💔3🤔2🤝2🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Sakana AI представила ALE-Bench и ALE-Agent — инструменты для работы с задачами, требующих сложной оптимизации
В партнёрстве с AtCoder Inc. команда Sakana AI разработала ALE-Bench — открытый бенчмарк, ориентированный на NP-трудные задачи, где важно не просто написать работающий код, а находить работающие и эффективные решения.
📌 Что делает ALE-Bench особенным:
• Задачи требуют долгосрочного планирования и нестандартного подхода
• Истинное оптимальное решение недостижимо, но текущее решение можно улучшать бесконечно
• Подходит для оценки reasoning‑моделей и продвинутых AI‑кодеров
🤖 Вместе с бенчмарком представили и ALE-Agent — автономного агента, обученного решать такие задачи с нуля.
В мае 2025 года он участвовал в AtCoder Heuristic Contest (AHC) — одном из самых сложных алгоритмических конкурсов — и занял 21‑е место из 1,000 участников.
• Блог: https://sakana.ai/ale-bench/
• Статья: https://arxiv.org/abs/2506.09050
• Датасет: https://huggingface.co/datasets/SakanaAI/ALE-Bench
• Код: https://github.com/SakanaAI/ALE-Bench
@ai_machinelearning_big_data
#ALEBench #AI #SakanaAI #Optimization #AtCoder #NPHard #AItools
В партнёрстве с AtCoder Inc. команда Sakana AI разработала ALE-Bench — открытый бенчмарк, ориентированный на NP-трудные задачи, где важно не просто написать работающий код, а находить работающие и эффективные решения.
📌 Что делает ALE-Bench особенным:
• Задачи требуют долгосрочного планирования и нестандартного подхода
• Истинное оптимальное решение недостижимо, но текущее решение можно улучшать бесконечно
• Подходит для оценки reasoning‑моделей и продвинутых AI‑кодеров
🤖 Вместе с бенчмарком представили и ALE-Agent — автономного агента, обученного решать такие задачи с нуля.
В мае 2025 года он участвовал в AtCoder Heuristic Contest (AHC) — одном из самых сложных алгоритмических конкурсов — и занял 21‑е место из 1,000 участников.
• Блог: https://sakana.ai/ale-bench/
• Статья: https://arxiv.org/abs/2506.09050
• Датасет: https://huggingface.co/datasets/SakanaAI/ALE-Bench
• Код: https://github.com/SakanaAI/ALE-Bench
@ai_machinelearning_big_data
#ALEBench #AI #SakanaAI #Optimization #AtCoder #NPHard #AItools
5❤61🔥23👍17🌭2
Media is too big
VIEW IN TELEGRAM
OpenAI запустила функцию создания изображений по текстовым запросам в WhatsApp через бота 1-800-ChatGPT. Ранее возможность генерировать картинки была доступна только в мобильном приложении и на сайте сервиса.
Владельцы платных аккаунтов ChatGPT получают дополнительные преимущества. Привязав подписку к WhatsApp, они увеличивают лимиты на генерацию. Данных о геодоступности интеграции и объема, на который увеличиваются лимиты, OpenAI не предоставила.
OpenAI в сети Х
Google официально представила стабильные версии Gemini 2.5 Pro и Flash, обещая улучшенную производительность при оптимальных затратах и скорости. Эти модели уже готовы к использованию в промышленных приложениях.
Параллельно анонсирована пробная версия Flash-Lite — самая дешевая и быстрая из линейки. Она показывает лучшие результаты, чем Gemini 2.0, в программировании, математике и обработке данных. Модель поддерживает работу с инструментами (поиск, исполнение кода) и обрабатывает до 1 млн. токенов за раз.
Доступ к Flash-Lite открыт через AI Studio и Vertex AI, а Pro и Flash в мобильном приложении Gemini.
blog.google
Adobe выпустила мобильное приложение Firefly для iOS и Android. Инструмент объединяет собственные модели Adobe и сторонние решения от OpenAI, Google (Imagen 3/4, Veo 2/3), Flux и других. Пользователи получают доступ к функциям Generative Fill, текстового генератора видео и улучшения изображений.
Приложения получили синхронизацию с Creative Cloud, а для использования некоторых ИИ-опций требуются генеративные кредиты. Подписчики Creative Cloud могут использовать Firefly бесплатно, но отдельные функции доступны по специальной подписке.
Обновленная платформа Firefly Boards, напоминающая FigJam, теперь поддерживает редактирование и создание видео на основе моделей Google и Adobe.
macrumors.com
Ultra, новый тариф, с объемом вычислений в 20 раз больше, чем у Pro стал возможен благодаря партнерству с OpenAI, Anthropic, Google и xAI. Эти компании обеспечили доступ к мощным вычислительным ресурсам.
Параллельно обновлен Pro-тариф: теперь он предлагает неограниченное использование с ограничениями по скорости, а лимиты на вызовы инструментов полностью сняты. Сохранение прежнего лимита в 500 запросов в день можно выбрать вручную.
cursor.com
Groq стал доступен для запуска моделей на Hugging Face Hub, платформа добавила компанию в число своих поставщиков вычислений. Groq предлагает рекордно низкие задержки благодаря собственным процессорам обработки языка, которые заменяют традиционные GPU. Поддерживаемые модели включают свежие открытые версии Llama 4 и Qwen QWQ-32B, полный список можно посмотреть тут.
Интеграция работает через веб-интерфейс и клиентский SDK, а оплата возможна двумя способами: через API-ключ Groq или через Hugging Face без наценок. Для бесплатных аккаунтов доступен ограниченный объем инференса, а PRO-пользователи получают $2 ежемесячного кредита.
huggingface.co
Основной фишкой стал «Reddit Insights powered by Community Intelligence», он в реальном времени отслеживает тренды и помогает тестирует идеи для кампаний. Еще один инструмент, «Conversation Summary Add-ons», позволяет брендам добавлять под рекламу позитивные комментарии пользователей о продукте.
Reddit, похоже, угадывает с трендом: автоматизация и аналитика становятся ключевыми в условиях жесткой конкуренции за внимание.
reuters.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48❤21🔥11🌭3😁2
Moonshot AI пополнил свое семейство Kimi моделью Kimi-Dev-72B, специализированной для программирования и разработанной для решения задач инженерии ПО. Она, как заявляют разработчики, особо эффективна в исправлении ошибок и написании тестов.
Ее сила в том, что она не просто пишет код, а имитирует мышление программиста, учитывая последствия изменений и проверяя их в автоматизированных тестах.
Специализация Kimi-Dev-72B состоит из 2 ролей: BugFixer (исправление ошибок) и TestWriter (написание тестов).
Эти роли работают в тандеме: BugFixer находит файлы, требующие правок, и предлагает код, который устраняет баг, а TestWriter создает тесты, которые должны провалиться без исправления и пройти после него. Обе роли используют одинаковый двухэтапный процесс — сначала локализация файла, затем редактирование кода.
Модель училась на данных с GitHub: миллионы задач и коммитов из реальных проектов. За основу взяли базовую Qwen 2.5-72B, которую дообучали на ~150 млрд. токенов, тщательно фильтруя данные, чтобы исключить тестовые наборы SWE-bench.
В процессе обучения с подкреплением, модель получала награду только если все тесты в Docker проходили успешно. Также применяли «умные» подсказки, отсеивая заведомо сложные задачи, и постепенное усложнение, добавляя сложные примеры по мере прогресса.
Kimi-Dev показала рекордные 60,4% на тесте SWE-bench Verified среди open-source решений.
В будущем планируется интеграция с IDE, CI/CD, чтобы сделать модель частью ежедневного рабочего процесса разработчиков.
@ai_machinelearning_big_data
#AI #ML #LLM #KimiDev #MoonshotAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍56🔥27❤12🥰4🌭3
This media is not supported in your browser
VIEW IN TELEGRAM
📚 ArXiv Research Agent — отличный помощник для научных исследований.
Агент самостоятельно:
• Найдёт релевантные статьи с arXiv, bioRxiv, medRxiv и Semantic Scholar
• Проведёт полноценный обзор и поиск нужных материалов
• Покажет, что упущено, и предложит, что добавить
• Даст инсайты и цитаты из миллионов научных работ
• Генерирует готовые конспекты
И др.
Вскоре обещают добавить поддержку MCP.
🔜 Попробовать: https://www.alphaxiv.org/assistant
@ai_machinelearning_big_data
#agent #ArXiv #ai #ml
Агент самостоятельно:
• Найдёт релевантные статьи с arXiv, bioRxiv, medRxiv и Semantic Scholar
• Проведёт полноценный обзор и поиск нужных материалов
• Покажет, что упущено, и предложит, что добавить
• Даст инсайты и цитаты из миллионов научных работ
• Генерирует готовые конспекты
И др.
Вскоре обещают добавить поддержку MCP.
@ai_machinelearning_big_data
#agent #ArXiv #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤82👍36🔥17🥰1😇1
👨💻 На GitHub выкатили опенсорс-песочницу для тестирования ИИ-алгоритмов рекламных ставок
Команда искусственного интеллекта Авито представила BAT (Benchmark for Auto-bidding Task) — первый российский опенсорс-инструмент для тестирования алгоритмов ставок в рекламных аукционах. Презентация состоялась на международной конференции The ACM Web Conference 2025, одном из главных международных событий в области машинного обучения.
Технические особенности платформы:
🟢 Реалистичная симуляция условий рекламных аукционов
🟢 Работает на анонимизированных данных, объем которых в 1000 раз превышает использовавшийся ранее датасет iPinYou (2013)
🟢 Включает 5 базовых алгоритмов от Авито для сравнения
🟢 Позволяет тестировать custom-алгоритмы перед внедрением в продакшн
Преимущества для ML-специалистов:
🟢 Доступ к реалистичной тестовой среде с параметрами современных рекламных систем
🟢 Возможность сравнивать эффективность разных подходов к автоматическим ставкам
🟢 Инструмент для тестирования алгоритмов без необходимости развертывания сложной инфраструктуры
BAT заполняет важный пробел в инструментарии для ML-сообщества, предлагая современную альтернативу устаревшему датасету iPinYou. Проект может задать новые стандарты в диджитал-рекламе.
🖥 GitHub
Команда искусственного интеллекта Авито представила BAT (Benchmark for Auto-bidding Task) — первый российский опенсорс-инструмент для тестирования алгоритмов ставок в рекламных аукционах. Презентация состоялась на международной конференции The ACM Web Conference 2025, одном из главных международных событий в области машинного обучения.
Технические особенности платформы:
🟢 Реалистичная симуляция условий рекламных аукционов
🟢 Работает на анонимизированных данных, объем которых в 1000 раз превышает использовавшийся ранее датасет iPinYou (2013)
🟢 Включает 5 базовых алгоритмов от Авито для сравнения
🟢 Позволяет тестировать custom-алгоритмы перед внедрением в продакшн
Преимущества для ML-специалистов:
🟢 Доступ к реалистичной тестовой среде с параметрами современных рекламных систем
🟢 Возможность сравнивать эффективность разных подходов к автоматическим ставкам
🟢 Инструмент для тестирования алгоритмов без необходимости развертывания сложной инфраструктуры
BAT заполняет важный пробел в инструментарии для ML-сообщества, предлагая современную альтернативу устаревшему датасету iPinYou. Проект может задать новые стандарты в диджитал-рекламе.
🖥 GitHub
🔥42❤18👍15🤣3🥰1
✔️ МТС Web Services и НИУ ВШЭ открыли набор на второй поток магистратуры по ИИ
Абитуриентов приглашают на магистерскую программу «Исследования и предпринимательство в искусственном интеллекте», ее анонсировали на True Tech Day. Обучение пройдет в московском кампусе ВШЭ, всего будет 30 оплачиваемых мест от МТС.
Программу создали на основе актуальных задач индустрии. Задача - научить применять передовые технологии, например, языковые модели и распознавание речи.
Лучших студентов пригласят на стажировку и работу в МТС Web Services уже во время обучения. Часть учебы может пройти за границей в рамках программы академического обмена. Подать документы можно будет с 20 июня.
@ai_machinelearning_big_data
Абитуриентов приглашают на магистерскую программу «Исследования и предпринимательство в искусственном интеллекте», ее анонсировали на True Tech Day. Обучение пройдет в московском кампусе ВШЭ, всего будет 30 оплачиваемых мест от МТС.
Программу создали на основе актуальных задач индустрии. Задача - научить применять передовые технологии, например, языковые модели и распознавание речи.
Лучших студентов пригласят на стажировку и работу в МТС Web Services уже во время обучения. Часть учебы может пройти за границей в рамках программы академического обмена. Подать документы можно будет с 20 июня.
@ai_machinelearning_big_data
🤣41❤16👍10🤔5🥱3🔥2🌭2
FlashInfer - это библиотека для ускорения работы с LLM, созданная NVIDIA, чтобы объединить скорость обработки на GPU и гибкость для разработчиков. Еt главная цель — сократить время вывода текста, одновременно позволяя инженерам быстро внедрять новые алгоритмы и адаптировать решения под разные задачи.
Ее архитектура спроектирована так, чтобы оставаться актуальной при появлении новых алгоритмов: будь то методы повторного использования кэша или эксперименты с форматами внимания. Плюс к этому, библиотека легковесна, она не требует установки лишних зависимостей, а ее API напоминает стандартные инструменты PyTorch.
FlashInfer базируется на 2 принципах : эффективное управление памятью и динамическое планирование вычислений. Библиотека оптимизирует хранение KV-cache через блочно-разреженные структуры, уменьшая объем лишних обращений к памяти.
Это особенно важно при обработке запросов с разной длиной текста. Также используется технология JIT-компиляции, которая на лету генерирует оптимизированные CUDA-ядра под конкретную задачу.
Архитектура FlashInfer разбита на 4 модуля: Attention, GEMM, Communication и Token sampling.
FlashInfer поддерживает PyTorch через собственные операторы и DLPack API, тем самым упрощает внедрение в фреймворки vLLM и SGLang. Благодаря разделению процесса на этапы «планирования» и «запуска» библиотека минимизирует задержки: на первом шаге выбирается оптимальное ядро под параметры запроса, а затем оно переиспользуется для последующих аналогичных задач.
@ai_machinelearning_big_data
#AI #ML #LLM #FlashInfer #NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48❤19🔥15🥰2
Media is too big
VIEW IN TELEGRAM
В первом эпизоде Сэм Альтман и Эндрю Мэйн говорят о том, что ждет нас дальше:
от GPT‑5 и AGI до суперкомпьютера Project Stargate и ИИ, помогающего воспитывать детей.
Приятного просмотра
▪ YouTube: https://www.youtube.com/watch?app=desktop&v=DB9mjd-65gw
▪ Spotify
https://open.spotify.com/show/0zojMEDizKMh3aTxnGLENP
▪ Apple:
https://podcasts.apple.com/us/podcast/openai-podcast/id1820330260
▪X: https://x.com/OpenAI/status/1935357512011890815
@ai_machinelearning_big_data
#OpenAI #chatgpt #AI #podcast
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47❤22🥱18🔥7🥰2🐳2🍓1💅1
Media is too big
VIEW IN TELEGRAM
OpenAI объявила, что больше не будет работать с Scale AI, стартапом, специализирующимся на разметке данных. Решение принято после того, как компания Марка Цукерберга инвестировала $14,3 млрд в Scale и переманила ее основателя Александра Ванга для создания «суперинтеллекта».
В OpenAI заявили, что Scale AI обеспечивал лишь небольшую часть их потребностей, а из-за роста сложности моделей требуются более квалифицированные партнеры. Теперь компания переключается на других поставщиков, Mercor, который раньше занимался рекрутингом, а теперь помогает в создании ИИ.
Для Scale AI это довольно ощутимый удар: потеря одного из ключевых клиентов и уход лидера всего за одну неделю.
bloomberg.com
После недель анонсов и сбора фидбэка, Midjourney представила свою первую Image-to-Video модель. Новая функция Animate позволяет превращать любые картинки в короткие анимационные ролики через автоматический или ручной режим. Режимы Low Motion и High Motion регулируют интенсивность движения. Видео можно продлевать до 16 секунд, добавляя описания к каждому фрагменту. Поддерживаются и сторонние изображения: их загружают как стартовый кадр, а движение задают текстовым промптом.
Ролики пока доступны в 480p при 24 кадрах в секунду. Генерация стоит в 8 раз больше, чем изображения, но компания утверждает, что это в 25 раз дешевле конкурентов. Для Pro-подписчиков тестируют Video Relax Mode, экономящий приоритетные минуты. По словам создателей, видео - это промежуточный этап перед объединением 3D, видео и реального времени в единой платформе.
midjourney.com
Компания SandboxAQ, выделенная из Google и поддержанная Nvidia, опубликовала массив данных, цель которого помочь ученым прогнозировать, как молекулы веществ взаимодействуют с целевыми белками в организме. Это критически важно на ранних этапах создания препаратов: если молекула не «прилипает» к нужному белку, лекарство не сработает.
Используя чипы Nvidia, компания сгенерировала 5,2 млн «синтетических» молекул — теоретических структур, основанных на реальных данных. Эти данные обучают ИИ-модели, которые за минуты вычисляют вероятность связывания, экономя месяцы ручных расчетов.
sandboxaq.com
Ученые из MIT провели эксперимент с 54 добровольцами, которые писали эссе, используя ChatGPT, Google или только свои знания. EEG-анализ показал: у участников с ChatGPT активность мозга была на 30% ниже, особенно в зонах, отвечающих за креативность и память. Со временем они начинали копировать ответы ИИ, теряя навыки формулирования идей. Зато группа без подсказок демонстрировала высокую нейронную связность — мозг работал активнее, генерируя идеи.
Автор исследования, Наталия Космина, предупреждает: чрезмерное доверие к ИИ угрожает обучению и критическому мышлению, особенно у детей. Она призналась, что вставила «ловушки» в текст статьи, чтобы проверить ИИ-суммаризаторы: те начали придумывать версии ChatGPT, которых не было в данных.
Следующий этап - изучение влияния ИИ на программирование. Первые результаты нового этапа, по словам авторов, пугают еще больше.
time.com
Baidu провела стрим, который может изменить будущее e-commerce, представив цифрового клона известного в Китае стримера Ло Юнхао на своей платформе, поддерживаемого моделью ERNIE. Это мероприятие стало первым в своем роде, где два цифровых аватара вели лайв-стрим одновременно.
Они привлекли более 13 миллионов просмотров за 6 часов и сгенерировали продаж товаров потребительской электроники на сумму более 55 миллионов юаней (7,6 млн. долл). Технология ERNIE позволила аватарам не только общаться в реальном времени, но и генерировать описания продуктов объемом более 97 тысяч символов.
Baidu в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44👍29🔥9🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Команда MiniMax представила MiniMax Agent — интеллектуального агента, способного решать многошаговые, долгосрочные и комплексные задачи.
Что умеет MiniMax Agent:
- Поддерживает комплексное и многошаговое планирование на уровне
- Разбиение задач на подзадачи и их исполнение
- МОщные инструменты генерации кода
- Мультимодальность
- Интеграция с MCP
🔗 https://agent.minimax.io
@ai_machinelearning_big_data
#AI #IntelligentAgent #MiniMax #MultiStepPlanning #Automation #ToolUse #MCP #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43🔥24👍12🥰6
Microsoft Research представила методы, усиливающие способность языковых моделей, от компактных до гигантских к сложным рассуждениям. Технологии фокусируются на 3 направлениях: архитектура малых моделей, математическая строгость и кросс-доменное обобщение.
Ключ для маленьких моделей (1.5–7 млрд параметров) в имитации человеческого пошагового мышления.
rStar-Math использует алгоритм MCTS в цикле самообучения: сначала декомпозиция задачи на шаги, затем Process Preference Model (PPM), который учит модель оценивать качество каждого шага через "метки награды", и наконец — итеративная доработка. За 4 цикла MCTS, стратегия и PPM совместно улучшают результат.
Logic-RL — это фреймворк обучения с подкреплением, который награждает модель только при идеально оформленном ходе рассуждений и верном ответе, исключая любые попытки выбора обходных путей.
Для математической надежности разработан LIPS, гибрид ИИ и символьных движков. LIPS распределяет задачи: языковая модель распознает паттерны и переформулирует условия (например, неравенства), а символьный решатель выполняет точные преобразования (масштабирование, упрощение).
Чтобы ИИ понимал условия без ошибок, создан нейро-символический фреймворк генерации данных: символьные системы создают задачи, а языковые модели переводят их в "человеческий" текст. Для проверки выводов используются символьная эквивалентность (сравнение формул) и семантическая согласованность (анализ смысла через эмбеддинги), повышая точность на 35%.
Дополнительный бонус — неожиданное обобщение. Тренировка на математике резко улучшила результаты моделей в программировании и естественных науках.
Для унификации подходов создан Chain-of-Reasoning (CoR), позволяющий гибко комбинировать текстовые, программные и символьные рассуждения в одном решении. А Critical Plan Step Learning (CPL) учит ИИ стратегическому планированию: разбивать проблему, выделять ключевые шаги и отбрасывать слабые варианты через комбинацию Plan-based MCTS и Step-APO.
@ai_machinelearning_big_data
#AI #ML #LLM #RL #Reasoning #Microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤60👍41🔥19🌭5🥰1🤣1
Media is too big
VIEW IN TELEGRAM
GitHub объявил о начале тарификации премиум-запросов в Copilot для всех платных планов с 18 июня 2025 года. Теперь пользователи будут получать ежемесячный лимит таких запросов, а неиспользованные остатки сгорают в конце месяца.
Премиум-запросы требуются для работы с мощными моделями вроде GPT-4.5 или Claude Opus 4, где каждый запрос умножается на коэффициент сложности (GPT-4.5 «съедает» 50 единиц за раз). Для бесплатного тарифа доступ ограничен: 2000 автодополнений кода и 50 премиум-запросов в месяц, причем все чаты считаются как "премиум".
Платные планы предлагают неограниченный доступ к базовым моделям (GPT-4.1, GPT-4o), но дополнительные запросы сверх лимита обойдутся в $0.04 за штуку. Если лимит исчерпан, можно переключиться на базовые модели — правда, их скорость зависит от нагрузки.
github.com
OpenAI предупредила, что ее будущие модели могут представлять повышенный риск создания биологического оружия. Чтобы предотвратить злоупотребления, OpenAI разрабатывает комплексную систему ограничений: обучение моделей игнорировать опасные запросы, автоматический мониторинг подозрительной активности, проверку экспертов и «Red Teams», тестирующие уязвимости.
Компания сотрудничает с лабораториями и правительствами, чтобы улучшить безопасность синтеза ДНК и создать системы раннего обнаружения патогенов. Для тех, кто работает с ИИ в научных целях, планируется отдельный доступ к мощным инструментам, при условии строгого контроля. В июле OpenAI проведет саммит по биозащите, чтобы объединить усилия государств и частного сектора в борьбе с новыми угрозами.
openai.com
Wix, популярный конструктор сайтов, приобрел Base44 — платформу вайбкодинга, позволяющую создавать приложения через текстовые запросы. Сделка оценивается в $80 млн, с возможными доплатами до 2029 года в зависимости от роста пользователей или выручки.
Base44 останется независимой, сохранив текущие инструменты: управление базами данных, аутентификацию, облачное хранение и хостинг. Платформа, насчитывающая 40 тыс. пользователей, недавно добавила чат-бота на основе ИИ для упрощения разработки.
techradar.com
YouTube подтвердил, что Google использует его архив из 20 млрд. видео для тренировки ИИ-моделей, включая Veo 3. Компания утверждает, что задействует лишь часть контента, соблюдая договоры с авторами, но не уточняет деталей. Создатели, чьи ролики могут попадать в обучающие наборы, не могут отключить такую опцию.
Эксперты опасаются, что это создаст конфликт интересов: ИИ, обученный на их материалах, может конкурировать с самими авторами. Некоторые уже выразили недовольство, подчеркнув, что не знали о таком использовании своего контента.
При этом ежедневно на YouTube добавляется несколько десятков миллионов новых видео - это потенциальный «корм» для алгоритмов. Вопрос регулирования ИИ и защиты прав авторов остаётся открытым, хотя YouTube ссылается на прозрачность своих политик.
cnbc.com
MiniMax, в рамках пятидневного марафона релизов "MiniMax Week" представила второе поколение видео-модели Hailuo 02, улучшенной за счет архитектуры NCR. Модель выросла в 3 раза по количеству параметров, при этом разработчики обещают улучшенное качество и разнообразие контента, но технические детали NCR пока не неизвестны.
Hailuo 02 справляется со сложными сценариями и по данным бенчмарка Artificial Analysis Video Arena она уступила только Bytedance Seedance, но обошла Google Veo 3.
Доступны 3 варианта генераций: 768p на 6/10 секунд и 1080p на 6 секунд. Цена в API за 6-секундный ролик в 768p — $0,28, а 1080p — $0,49. Модель доступна через веб-интерфейс, мобильное приложение или API.
mp.weixin.qq.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43❤29🔥17👌3😁2🌭1🤨1