Раньше процесс проходил через три этапа: распознавание речи, перевод текста и синтез новой речи, из-за чего задержка могла достигать десятков секунд.
Исследователи оптимизировали весь конвейер, сделали обработку более устойчивой и сократили время реакции. Перевод звучит естественнее, меньше «подправляется» в реальном времени, а паузы стали значительно короче.
Технология приближает момент, когда люди смогут свободно общаться, даже если не знают языка собеседника.
https://research.google/blog/real-time-speech-to-speech-translation
@ai_machinelearning_big_data
#Google #AI #Translation #SpeechToSpeech #GoogleResearch
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤120👍46🔥41😁4🥰3👻3
💡 DeepSeek выложили новый open-source проект — LPLB.
Это экспериментальный балансировщик нагрузки для моделей Mixture-of-Experts (MoE).
В репозитории описано, как система:
• динамически перераспределяет экспертов, опираясь на статистику нагрузки;
• создаёт реплики с учётом топологии кластера;
• решает оптимальное распределение токенов по экспертам через LP-решатель, работающий прямо на GPU (cuSolverDx + cuBLASDx);
• использует метрики загрузки, полученные вручную, через torch.distributed или через буферы Deep-EP.
Гайд показывает, как может выглядеть умный и точный балансировщик для больших MoE-архитектур.
GitHub: https://github.com/deepseek-ai/LPLB
ai_machinelearning_big_data
#DeepSeek #LPLB #MoE #AIInfrastructure #OpenSource
Это экспериментальный балансировщик нагрузки для моделей Mixture-of-Experts (MoE).
В репозитории описано, как система:
• динамически перераспределяет экспертов, опираясь на статистику нагрузки;
• создаёт реплики с учётом топологии кластера;
• решает оптимальное распределение токенов по экспертам через LP-решатель, работающий прямо на GPU (cuSolverDx + cuBLASDx);
• использует метрики загрузки, полученные вручную, через torch.distributed или через буферы Deep-EP.
Гайд показывает, как может выглядеть умный и точный балансировщик для больших MoE-архитектур.
GitHub: https://github.com/deepseek-ai/LPLB
ai_machinelearning_big_data
#DeepSeek #LPLB #MoE #AIInfrastructure #OpenSource
❤46🔥25👍19😁2🙉2🥰1
https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/gemini-3-pro-image-preview?pli=1
Попробовать: https://deepmind.google/models/gemini-image/pro/
@ai_machinelearning_big_data
#ai #ml #nanobanana
Please open Telegram to view this post
VIEW IN TELEGRAM
❤46🔥18👍13😨3🤬1
ML-модели не работают без правильно подготовленных данных.
Качество данных определяет качество моделей. Но что делать, когда пайплайны ломаются, а данные из разных источников приходят с расхождениями? Пока одна часть команды занимается ETL, другая — ищет причины артефактов в обучении моделей.
✔️ В таких ситуациях может пригодиться бот-генератор оправданий.
Он предлагает нестандартные объяснения, почему данные не готовы для обучения — от шуток про "несходящиеся градиенты" до "конфликта фичей".
Когда в следующий раз ваш feature store будет выглядеть как поле боя — загляните к боту. Его объяснения могут оказаться правдоподобнее ваших. Сгенерируйте несколько вариантов и поделитесь с командой — это поможет найти нестандартный подход к решению проблемы.
Качество данных определяет качество моделей. Но что делать, когда пайплайны ломаются, а данные из разных источников приходят с расхождениями? Пока одна часть команды занимается ETL, другая — ищет причины артефактов в обучении моделей.
Он предлагает нестандартные объяснения, почему данные не готовы для обучения — от шуток про "несходящиеся градиенты" до "конфликта фичей".
Когда в следующий раз ваш feature store будет выглядеть как поле боя — загляните к боту. Его объяснения могут оказаться правдоподобнее ваших. Сгенерируйте несколько вариантов и поделитесь с командой — это поможет найти нестандартный подход к решению проблемы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🗿33❤15🔥9😁8👍7😭3
Главное:
• 32B base - сильная base-модель, которая работает на уровне Qwen 2.5 и опережает на ряде бенчмарков Google Gemma 3.
• 7B instruct и 7B reasoning - лучшие среди западных моделей
• 32B Think - полностью открытая 32B-модель для сложных рассуждений (почти на уровне Qwen 3 8B/32B)
Все данные, код, чекпоинты в открытом доступе.
Olmo 3 32B - закрыла важный пробел, так как у Qwen нет открытой 32B base-версии.
32B спокойно запускаестя на одной 80GB-GPU или даже на мощном ноутбуке.
@ai_machinelearning_big_data
#Olmo #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40🔥20👍15🥰9🦄2😁1🐳1
Media is too big
VIEW IN TELEGRAM
Создатели Segment Anything обновили свой стек компьютерного зрения, выпустив третье поколение инструментов SAM. Модель SAM 3 делает ставку на высокую точность: она умеет не только определять и отслеживать объекты в видеопотоке, но и понимает сложные текстовые описания.
Второй релиз, SAM 3D, решает задачу объемной реконструкции. Инструмент преобразует обычные 2D-изображения в 3D-ассеты. Технология разделена на два направления: SAM 3D Objects для воссоздания сцен и предметов, и SAM 3D Body для точной оценки человеческой анатомии и переноса её в виртуальную среду. Код и веса SAM 3 уже опубликованы в открытом доступе, а для 3D-версии разработчики выложили чекпоинты и инструменты инференса.
github.com
PINA - опенсорсная библитека от SISSA Mathlab для задач Scientific Machine Learning (SciML), нативно построеная на PyTorch и PyTorch Lightning и полностью совместима с PyTorch Geometric. Она предлагает единый подход к решению сложных научных проблем: от аппроксимации дифференциальных уравнений в частных производных до моделирования силовых полей и деформаций объектов.
PINA построена на модульной архитектуре, которая минимизирует шаблонный код и четко разделяет определение задачи, модель, солвер и процесс обучения. Внутри уже предусмотрены необходимые для физического моделирования инструменты: дифференциальные операторы, soft constraints и специфические функции потерь.
pytorch.org
Биотех-стартап Nabla Bio объявил о запуске JAM-2, первого алгоритма для создания de novo антител, готовых к применению в фармацевтике. Разработчики позиционируют инструмент как способ перевести создание лекарств из формата случайного перебора в дисциплину точного инженерного дизайна.
Модель показала высокую эффективность даже при работе со сложными мишенями, такими как клеточные рецепторы GPCR. В ходе тестов JAM-2 генерировала антитела с пикомолярной аффинностью, при этом более 50% вариантов сразу соответствовали индустриальным критериям пригодности без дополнительной оптимизации.
Команда из 4 инженеров смогла параллельно обработать 16 разных мишеней менее чем за месяц.
Nabla Bio в сети X
Лаборатория Nof1 запустила новый этап соревнования торговых ботов, в котором ИИ-модели управляют акциями на фондовом рынке США. В списке участников — Qwen3, DeepSeek, Claude Sonnet, Gemini, Grok, GPT-5, Kimi 2 и неназванная секретная модель. Каждому алгоритму выделили стартовый депозит в $10 000 и предоставили полную автономию в принятии решений.
Организаторы существенно усложнили турнир новыми сценариями. В режиме «New Baseline» модели используют память и механизм рефлексии для самообучения, а трек «Situational Awareness» позволяет ботам отслеживать рейтинг конкурентов в реальном времени. Наиболее агрессивный режим «Max Leverage» обязывает использовать высокое кредитное плечо.
Прошлый сезон закончился для ИИ-трейдеров неудачно: 4 из 6 моделей ушли в минус.
nof1.ai
Компания представила инициативу «ChatGPT for Teachers», открывающую бесплатный доступ к чат-боту для преподавателей американских школ. В этой версии используется защищенное рабочее пространство, которое не передает данные для дообучения нейросетей, соответствуя стандартам конфиденциальности FERPA.
Учителя получат доступ к модели GPT-5.1 Auto, а также нативные интеграции с Canva и Google Drive. Администраторам учебных заведений доступны инструменты для централизованного распределения лицензий. Программа рассчитана до июня 2027 года и позиционируется как автоматизация планирования уроков и сокращения времени на административную рутину.
openai.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40❤26❤🔥7🥰3💘1🦄1
Не кодь — вайбкодь. Бесплатно 🚀
Сбер представил бесплатный агентный режим GigaCode — нового цифровой разработчика, который берет на себя рутину, чтобы вы могли сосредоточиться на крутых задачах!
Что умеет GigaCode в агентном режиме?
⏩ Сам находит и открывает нужные файлы
⏩ Вносит изменения в код, запускает тесты, собирает проекты и оформляет коммиты в Git
⏩ Работает в вашей любимой среде: JetBrains IDE, GigaIDE Desktop, а скоро еще и в VS Code
Плюс, в GigaCode появилась новая модель автодополнения кода — GigaCode Inline 4.0. Она мгновенно предлагает нужные фрагменты кода для Python, Java, JavaScript и других языков. Подсказки стали еще точнее, а работа с контекстом — еще лучше.
🖱 Хотите ускорить разработку? Обновленный GigaCode уже доступен на GitVerse.
Начать вайбкодить — по ссылке
Сбер представил бесплатный агентный режим GigaCode — нового цифровой разработчика, который берет на себя рутину, чтобы вы могли сосредоточиться на крутых задачах!
Что умеет GigaCode в агентном режиме?
Плюс, в GigaCode появилась новая модель автодополнения кода — GigaCode Inline 4.0. Она мгновенно предлагает нужные фрагменты кода для Python, Java, JavaScript и других языков. Подсказки стали еще точнее, а работа с контекстом — еще лучше.
Начать вайбкодить — по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱77🤣38👍21🤨16❤13🤬7🥰3😁3🕊1💔1🗿1
Забегая вперед, это были не лабораторные тесты, а полноценное боевое крещение, которое длилось 11 месяцев. Всего через полгода после запуска, роботы Figure 02 уже были на заводе, а к десятому месяцу они вышли на полную рабочую загрузку.
Роботы трудились 10-часовыми сменами с понедельника по пятницу. За более чем 1250 рабочих часов они загрузили свыше 90 тысяч деталей, внеся свой вклад в производство более 30 тысяч автомобилей серии X3. По оценкам инженеров, за этот период роботы сделали более 1.2 млн. шагов, пройдя расстояние чуть больше 320 км.
Основным кейсом использования стала операция загрузки листового металла — классическая задача по перекладыванию деталей. Процесс требовал от робота взять металлические листы и поместить их в сварочный агрегат с допуском всего в 5 миллиметров.
Чтобы оценить эффективность, инженеры установили жесткие KPI.
Такие условия потребовали от Figure разработки продвинутых алгоритмов координации "рука-глаз" и адаптивной локомоции.
Но любой экспериментальный проект — это прежде всего про поиск слабых мест.
С выходом новой модели Figure 03, второе поколение роботов официально отправляется на пенсию. Опыт, полученный на заводе BMW, напрямую повлиял на архитектуру третьего поколения.
Главным "узким местом" Figure 02 оказалось предплечье. Из-за плотной компоновки и требований к ловкости, эта часть часто перегревалась и была сложна в обслуживании.
В Figure 03 полностью изменили архитектуру электроники запястья. Они убрали распределительную панель и избавились от динамической кабельной разводки. Теперь контроллеры моторов общаются с главным компьютером напрямую.
Это тот самый случай, когда тысячи часов реальной работы на заводе превращаются в конкретные инженерные улучшения.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤69👍41🔥7🥰7🦄5❤🔥2🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
Nano Banana очень хороша для генерации схем и слайдов, а как насчёт сделать из них видео. 🎬
Google Vids вместе с Gemini позволяет автоматически превратить презентацию Google Slides в полноценный видеоролик: со сценарием, озвучкой и музыкой.
Вы просто загружаете презентацию, выбираете стиль - и система сама собирает видео из ваших слайдов.
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@ai_machinelearning_big_data
#Gemini #google #llm
Google Vids вместе с Gemini позволяет автоматически превратить презентацию Google Slides в полноценный видеоролик: со сценарием, озвучкой и музыкой.
Вы просто загружаете презентацию, выбираете стиль - и система сама собирает видео из ваших слайдов.
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@ai_machinelearning_big_data
#Gemini #google #llm
👍67❤20🔥7🦄2💯1
В МТС Live Холл вот-вот стартует финальный этап всероссийского чемпионата по программированию True Tech Champ. А пока участники готовятся программировать роботов и решать алгоритмические задачи, гости и зрители онлайн-трансляции слушают лекцию Тони Янга, директора по североамериканскому бизнесу Unitree Robotics.
Он выступает с докладом «Будущее человекоподобных роботов» и обсудит с участниками, как человекоподобные роботы помогут решить проблему нехватки рабочей силы.
Ссылка на трансляцию : https://truetechchamp.ru/guests
Он выступает с докладом «Будущее человекоподобных роботов» и обсудит с участниками, как человекоподобные роботы помогут решить проблему нехватки рабочей силы.
Ссылка на трансляцию : https://truetechchamp.ru/guests
🤣24❤19👍8🔥4🥱3👀2🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
💡Внедрение ИИ полностью меняет разработку кода — Т-Технологии представили свою экосистему AI for SDLC
Главное:
• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков
Внутри экосистемы:
•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code
Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.
@ai_machinelearning_big_data
#news #ai #ml
Главное:
• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков
Внутри экосистемы:
•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code
Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.
@ai_machinelearning_big_data
#news #ai #ml
1🤣37🔥19❤15👏9👍4👌4🥰3🗿3🙈2
Главное, что действительно интересно:
• GPT-5 больше не просто пересказывает исследования
Модель выводит новые математические формулы, находит новые сложные теоремы и улучшает их.
• GPT-5 работает с физиками над симметриями чёрных дыр - и делает это правильно
Структуры SL(2,R) в искривлённом пространстве-времени - это не автокомплит. Это настоящая работа с абстракциями.
• GPT-5 находит редкие научные источники, которые человек бы не увидел
Старые доказательства, спрятанные в малоизвестных журналах, модель откапывает буквально за минуты.
• GPT-5 предлагает новые биологические механизмы на основе “сырых” данных
И самое удивительное - эти механизмы совпадают с результатами экспериментов, которые ещё не были опубликованы.
• GPT-5 формирует предложения экспериментов, которые тянут на уровень соавтора
Это уже не просто инструмент учёного. Это новая часть научного процесса.
Что всё это означает:
• Стоимость научного открытия стремительно падает
• Узкие экспертные bottleneck’и распадаются
• Команды “человек + ИИ” скоро смогут работать быстрее целых научных направлений
• Мы переходим от “ИИ помогает” → к “ИИ реально ускоряет науку”
Впервые ИИ способен сжимать весь научный цикл - от идеи до результата - и делать это внятно, проверяемо и воспроизводимо.
Если вы спрашиваете, как выглядит начало технологической Сингулярности -
скорее всего, это очень похоже именно на то, что показано в этой работе.
Подробности: https://openai.com/index/accelerating-science-gpt-5/
@ai_machinelearning_big_data
#openai #chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
👍80😁43❤23🔥10❤🔥3🦄3🥰2👏1🤨1🤓1
Forwarded from Анализ данных (Data analysis)
Media is too big
VIEW IN TELEGRAM
Построенная на архитектуре DiT, модель поднимает планку по качеству и доступности.
Что важно:
⚡️ Всего 8.3B параметров - модель можно запускать даже на потребительских GPU с 14GB VRAM
🖥️ Качество: генерирует 5–10 секунд видео в 480p/720p, а через суперразрешение —ё- до 1080p с киношной детализацией
SOTA-качество с очень низкими требованиями к железу.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41❤15🔥3🥰2🦄2☃1
🚀 Облачный провайдер Cloud.ru запустил среду для работы с искусственным интеллектом Evolution AI Factory в коммерческую эксплуатацию
Теперь все сервисы предоставляются по доступным тарифам с гарантированным уровнем сервиса (SLA), круглосуточной поддержкой и возможностью масштабирования нагрузки.
🔥 Главное
• Средняя цена на доступ к открытым большим языковым моделям составит 35 рублей за входной и 70 за выходной миллион токенов.
• Пользователям Evolution AI Factory доступно 20+ опенсорс-моделей, включая GigaChat, Qwen, ChatGPT.
• AI Factory состоит из шести взаимосвязанных сервисов, необходимых для полного цикла работы с AI. Это сервис ML Inference, который позволяет быстро развернуть и модели из каталога Hugging Face или собственные модели. Также: Evolution Notebooks для работы и экспериментов с машинным обучением, запуска и тестирования ML-гипотез, ML Finetunung — для дообучения моделей под задачи бизнеса, RAG для повышения точности ответов моделей, Foundation Models с популярными LLM и AI Agents для создания агентов.
С запуском Evolution AI Factory компании получают не просто доступ к современным AI-инструментам, а возможность быстрее и понятнее превращать свои идеи в рабочие решения.
Теперь все сервисы предоставляются по доступным тарифам с гарантированным уровнем сервиса (SLA), круглосуточной поддержкой и возможностью масштабирования нагрузки.
🔥 Главное
• Средняя цена на доступ к открытым большим языковым моделям составит 35 рублей за входной и 70 за выходной миллион токенов.
• Пользователям Evolution AI Factory доступно 20+ опенсорс-моделей, включая GigaChat, Qwen, ChatGPT.
• AI Factory состоит из шести взаимосвязанных сервисов, необходимых для полного цикла работы с AI. Это сервис ML Inference, который позволяет быстро развернуть и модели из каталога Hugging Face или собственные модели. Также: Evolution Notebooks для работы и экспериментов с машинным обучением, запуска и тестирования ML-гипотез, ML Finetunung — для дообучения моделей под задачи бизнеса, RAG для повышения точности ответов моделей, Foundation Models с популярными LLM и AI Agents для создания агентов.
С запуском Evolution AI Factory компании получают не просто доступ к современным AI-инструментам, а возможность быстрее и понятнее превращать свои идеи в рабочие решения.
❤28👍21🤣11🦄7🥰4
Forwarded from Machine learning Interview
🤖 AITradeGame - Симулятор торговли с ИИ
AITradeGame - это открытый симулятор торговли, который позволяет пользователям тестировать стратегии с использованием ИИ. Доступны как локальная версия с полной конфиденциальностью, так и онлайн-версия с интерактивными функциями и таблицами лидеров.
🚀Основные моменты:
- Поддержка различных ИИ моделей, включая OpenAI и Claude.
- Локальное хранилище данных без облачного отслеживания.
- Интерактивные таблицы лидеров для соревнований с другими пользователями.
- Удобный интерфейс и возможность настройки торговых параметров.
📌 GitHub: https://github.com/chadyi/AITradeGame
AITradeGame - это открытый симулятор торговли, который позволяет пользователям тестировать стратегии с использованием ИИ. Доступны как локальная версия с полной конфиденциальностью, так и онлайн-версия с интерактивными функциями и таблицами лидеров.
🚀Основные моменты:
- Поддержка различных ИИ моделей, включая OpenAI и Claude.
- Локальное хранилище данных без облачного отслеживания.
- Интерактивные таблицы лидеров для соревнований с другими пользователями.
- Удобный интерфейс и возможность настройки торговых параметров.
📌 GitHub: https://github.com/chadyi/AITradeGame
🔥32❤13👍11👀6