Machinelearning – Telegram
338K subscribers
4.62K photos
948 videos
17 files
5.05K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Forwarded from Rust
🦀 Strand-Rust-Coder-14B - модель, заточенная специально под генерациию Rust кода.

Это не универсальный «кодинг-ассистент».
Модель дообучена именно на экосистеме Rust и пишет код на уровне опытного разработчика:
- идиоматичный Rust
- безопасная работа с памятью
- корректные async и ownership-паттерны
- акцент на производительность и системные задачи

Большинство моделей хорошо знают Python и JavaScript, но часто «путаются» в borrow checker, lifetimes и сложных Rust-конструкциях.

Strand-Rust-Coder решает именно эту проблему - фокус на системном программировании, low-level задачах и performance-critical приложениях.

https://huggingface.co/Fortytwo-Network/Strand-Rust-Coder-14B-v1

@rust_code
1👍85🔥2112👏11💯5🤔3😁2
⚡️ VK внедряет VLM в поиск VK Видео

VK начала внедрение визуально-языковых моделей в поисковые системы своих продуктов. Технология уже работает в VK Видео. Теперь система анализирует не только название и описание ролика, но и сами кадры, звук и видеоряд.

Тестирование гипотез ускорилось в 5 раз, новые улучшения внедряются заметно быстрее, а поиск будет развиваться динамичнее.

Технология также усилит векторный поиск. Система будет опираться не только на семантическое совпадение слов, но и на реальное содержание видео через анализ аудио и визуальных признаков.
Подобные мультимодальные подходы развивают Microsoft, Google и TikTok. Обновление поэтапно появится и в других сервисах VK.

@ai_machinelearning_big_data

#news #ai #ml #VK
1🤣98👍73🔥20👏8🥱7🤷‍♂5🗿5😁2🤔2🌚2😴1
⚡️ Релиз Gemini 3.1 Pro - новый уровень интеллекта моделей

Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2.

- Резкий скачок качества
Результат почти в 2 раза выше, чем у предыдущей версии

- Обгоняет конкурентов
Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление

- Сильнее в реальных сценариях
- программирование
- агентные задачи
- работа с новыми паттернами без примеров

- Новые возможности
Модель может генерировать анимированные SVG из текста и решать логические задачи, которых не было в обучающей выборке — это важный шаг к более универсальному AI.

Попробовать Gemini 3.1 Pro уже можно в Google AI Studio: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

@ai_machinelearning_big_data
1🔥1263938👍12🤩11🙊10😴9🤷‍♂6👏6🌭5🙈5
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI поглотила команду поискового стартапа Nerve.

Команда Nerve переходит в OpenAI в рамках сделки формата acqui-hire. Технологии стартапа будут интегрированы в существующие продукты OpenAI для улучшения механизмов поиска на рабочих местах.

До поглощения Nerve работала как единый хаб. Система умела извлекать данные из корпоративных документов, электронной почты, Google Drive и Slack, заменяя рутинный ручной поиск автоматизированными сценариями.

Наработки Nerve станут инфраструктурным компонентом для создания будущих ИИ-агентов, способных самостоятельно оперировать корпоративной информацией и выполнять сложные многошаговые задачи.
usenerve.com

✔️ ByteDance открыла около 100 вакансий в США.

Китайская корпорация активно нанимает инженеров и исследователей в Сан-Хосе, Лос-Анджелесе и Сиэтле для лаборатории Seed.Перед кандидатами ставятся задачи по подготовке датасетов для LLM, улучшению алгоритмов генерации видео и изображений, а также разработка научных моделей для дизайна лекарственных препаратов.

Отдельный фокус сделан на проекте Seed Edge Research, цель которого в создании систем с человекоподобными способностями к обучению.

Агрессивный наем происходит на фоне многолетнего давления американских регуляторов. Несмотря на это, ByteDance явно не планирует уступать технологическую гонку и усиливает свои R&D-центры на территории конкурентов.
bloomberg.com

✔️ Microsoft научилась записывать данные в боросиликатное стекло.

В рамках проекта Project Silica инженеры решили фундаментальную проблему деградации носителей в дата-центрах. В Nature вышла статья о важном сдвиге: команда отказалась от дорогого чистого кварца в пользу доступного боросиликатного стекла. Фемтосекундные лазеры "прожигают" в пластине толщиной 2 мм сотни слоев информации

Фишка исследования — изобретение «фазовых вокселей». Раньше методы опирались на поляризацию, а новый подход изменяет фазу стекла и требует лишь одного лазерного импульса на воксель. Чтобы разобрать эту плотную трехмерную структуру и убрать искажения, Microsoft подключила нейросети. Скорость записи подняли, запустив несколько лучей параллельно, а само устройство упростили: теперь для чтения хватает одной камеры вместо четырех.

Стеклянный носитель не боится воды, высоких температур и пыли. Тесты на старение подтвердили, что записанная информация останется неизменной минимум несколько тысячелетий. На этом исследовательская часть Project Silica закончена. Технология готова, теперь на ее основе можно строить хранилища.
microsoft.com

✔️ Google запустила генератор продуктового фото.

Новая функция Photoshoot - часть маркетинговой платформы Pomelli. Инструмент ориентирован на малый и средний бизнес, он превращает через Nano Banana фотографии товаров в качественные студийные и лайфстайл-кадры без затрат на продакшен.

Платформа автоматически парсит сайт компании, извлекает фирменные цвета, шрифты и общую эстетику бренда для применения к генерируемому контенту. Сервис предлагает готовые визуальные пресеты, замену фона по текстовому запросу и перенос стиля с референсов. Пока это бесплатная бета, но только для США, Канады, Австралии и Новой Зеландии.
blog.google

✔️ Tavus сделала модель реалистичного рендеринга лица в реальном времени.

Phoenix-4 покадрово генерирует каждый пиксель лица и головы виртуального собеседника, опираясь на датасет из тысяч часов реальных диалогов.

Киллер-фича Phoenix-4 в способности анализировать контекст беседы и демонстрировать эмпатию. Модель знает более 10 эмоций и умеет плавно переключаться между ними в реальном времени. Разработчики заверяют, что тем самым победили эффект «зловещей долины».

Технически все серьезно: HD-видео, 40 кадров в секунду. Tavus предлагает использовать это в продажах, обучении и медицине - там, где человеку важно внимание.
tavus.io

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
763👍52🔥15👏4🌚3🥰2
📌 Аnthropic измерил, как люди на самом деле используют ИИ-агентов.

Создатели Claude проанализировали миллионы взаимодействий в Claude Code и через публичный API с помощью их инструмента Clio, чтобы понять, сколько автономии люди реально дают агентам, в каких доменах те работают и насколько рискованны их действия.

🟡 Агенты работают все дольше без участия человека.

За 3 месяца медианная длина самых долгих сессий в Claude Code почти удвоилась - с 25 до более чем 45 минут непрерывной работы. Причем рост плавный и не коррелирует с релизами новых моделей.

Это значит, что дело не только в возможностях модели, а в том, как пользователи выстраивают взаимодействие с агентом.

🟡Опытные пользователи ведут себя иначе, чем новички.

Среди тех, кто только начинает пользоваться Claude Code, около 20% сессий запускают с полным авто-апрувом, это когда агент выполняет все действия без подтверждений.

У опытных пользователей эта доля больше 40%. Плюс они чаще прерывают агента вручную.
Аnthropic предполагает, что это не потому, что теряется доверие, а потому что они берутся за более сложные задачи и лучше понимают, когда нужно вмешаться.

🟡Неочевидный факт: агент сам ограничивает свою автономию чаще, чем это делает человек.

На самых сложных задачах Claude Code останавливается и задает уточняющий вопрос вдвое чаще, чем по принудительному прерыванию человеком.

🟡Картина по доменам

Почти половина всей агентной активности через API - за разработкой ПО.

Есть прирост использования в медицине, финансах и кибербезопасности, но пока в небольших объемах.

По итогу исследования, Аnthropic пришла к выводу, что эффективный надзор за агентами требует не только технических ограничений, но и новой инфраструктуры пост-деплойного мониторинга и новых паттернов взаимодействия - где и человек, и агент совместно управляют автономией и рисками.

Текущие модели, по данным компании, технически способны на большую самостоятельность, чем им позволяют на практике.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🤔61👏45💋40😎28😢27🤣23🎉2219🫡16👨‍💻15
AI уже не запрещают на собеседованиях – его требуют

В Циане изменили подход к найму: кандидатам в Product & Technology и HR рекомендуют выполнять тестовые задания и live coding с помощью AI-ассистентов.

Компания оценивает не только результат, но и то, как человек работает с AI:
- качество взаимодействия с инструментом
- скорость решения задач
- умение проверять и дорабатывать ответы
- соблюдение принципов безопасного и этичного использования

Сегодня более 75% разработчиков в компании уже используют AI в работе.

По словам Максима Радюкова, директора по информационным технологиям Циана, владение AI-инструментами становится нормой рынка, а инвестиции в эти навыки – ключевым конкурентным преимуществом.

В планах – масштабировать подход на всех сотрудников.

Вывод

Раньше на собеседовании проверяли, умеешь ли ты кодить.
Теперь – умеешь ли ты эффективно работать вместе с AI.

AI перестаёт быть «читом» – он становится базовым рабочим инструментом.
👍88🤝40😁287👏6🤔6🔥5👨‍💻5👾3🎅2🥰1
📌Насколько Skills реально помогают LLM-агентам.

SkillsBench — исследование и первый бенчмарк, где Agent Skills тестируются как самостоятельный артефакт.

Авторы из 15+ топовых университетов взяли 84 задачи из 11 доменов, запустили 7 конфигураций моделей (Claude Code с Opus/Sonnet/Haiku 4.5 и 4.6, Gemini CLI с Gemini 3 Pro/Flash, Codex с GPT-5.2) и проверили 3 условия: без Skills, с готовыми Skills и с самостоятельно сгенерированными Skills. Итого: 7 308 траекторий с детерминированными верификаторами на pytest.

Готовые Skills в среднем поднимают pass rate на 16,2 процентных пункта: с 24,3% до 40,6%. Но картина неоднородная: в медицине прирост составил +51,9%, для производства — +41,9%, тогда как в разработке ПО всего +4,5%.

Это объяснимо: там, где модели плохо покрыты обучением (клинические протоколы, промышленные воркфлоу), Skills дают максимальный эффект. Там, где модель и так знает домен - почти ничего.

🟡Главный и неожиданный результат: самогенерация Skills не работает.

Когда моделям предлагали сначала написать нужные гайды, а потом решать задачу, средний результат упал на 1,3% по сравнению с работой вообще без Skills. Только Claude Opus 4.6 показал скромный плюс (+1,4%), а GPT-5.2 просел на 5,6%.

Иными словами - модели не умеют надежно создавать то знание, которым умеют пользоваться.


🟡Еще один интересный момент - это объем Skills.

Оптимальный вариант: 2–3 модуля, прирост +18,6%. При 4 и более - всего +5,9%. Подробная документация вообще дает отрицательный эффект: –2,9%, с ней агент буквально тонет в контексте.

Показательна и стоимость решения задач: Haiku 4.5 со Skills обходит Opus 4.5 без Skills — меньшая и более дешевая модель с готовыми Skills бьет старшую модель без них.

Gemini 3 Flash при этом показал лучший абсолютный результат среди всех конфигураций - 48,7% со Skills при цене $0,57 за одну задачу против $1,06 у Gemini 3 Pro.


🟡Страница проекта
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #Benchmark #Skills
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🤓4518🤔9👏8❤‍🔥6👌5🔥1🥰1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI выпустит умную колонку с камерой в 2027 году.

Компания готовит к запуску линейку фирменных гаджетов. Первым устройством станет умная колонка. Ее релиз ожидается не раньше февраля 2027 года по цене от 200 до 300 долларов.

Фишкой гаджета станет встроенная камера с функцией распознавания лиц. Устройство сможет анализировать происходящее вокруг и давать проактивные советы. Производство аппаратных новинок планируют поручить компании Foxconn.

Колонка станет отправной точкой для новой экосистемы. В разработке также находятся умные очки (старт производства в 2028 гоу), беспроводная гарнитура Sweetpea, умный стилус Gumdrop и прототип настольной лампы.
theinformation.com

✔️ Команда llama.cpp и GGML присоединилась к Hugging Face.

Георгий Герганов и его команда переходят в Hugging Face. Проект llama.cpp останется полностью открытым и независимым. Разработчики сохранят за собой техническое руководство, а Hugging Face обеспечит финансирование и ресурсы.

Цель партнерства - техническая интеграция. Поскольку transformers де-факто стала стандартом для архитектур ИИ-моделей, а llama.cpp выступает фундаментом для их локального инференса, команды хотят максимально упростить связку этих инструментов. В будущем развертывание новых моделей из transformers в llama.cpp должно работать в один клик.

Также планируется улучшить упаковку и общий пользовательский опыт архитектуры GGML. Hugging Face делает ставку на то, что локальный инференс вскоре станет альтернативой облачным вычислениям.
huggingface.co

✔️ Claude научился создавать и редактировать презентации внутри PowerPoint.

Anthropic выпустила официальную интеграцию ИИ-ассистента для Microsoft PowerPoint. Плагин уже появился в Microsoft Marketplace и доступен в статусе бета-версии для подписчиков тарифов Pro, Max, Team и Enterprise.

Через Claude можно генерировать целые презентации или править отдельные слайды с помощью текстовых запросов. Чат-бот понимает контекст текущего дизайна - он умеет считывать макеты, шрифты и цветовую палитру из образца слайдов. Таким образом, все новые элементы и сгенерированный контент автоматически подстраиваются под корпоративный стиль или существующее оформление документа.
claude.com

✔️ Pika Labs анонсировала сервис цифровых двойников с долгосрочной памятью.

Новая функция AI Selves позволит развернуть виртуального двойника, который обладает памятью, уникальным характером и способен самостоятельно общаться с другими людьми. За мимику и артикуляцию при разговоре отвечают собственные аудиовизуальные модели лаботатории.

Пользователи смогут детально настраивать свою копию: задавать голос, манеру общения и загружать конкретные факты биографии или личные предпочтения. Процесс напоминает воспитание аватара, где создатель несет ответственность за заложенные в ИИ инструкции. Предполагается, что такие агенты будут интегрированы в мессенджеры и соцсети, где смогут общаться и действовать от имени пользователя.

Pika Labs открыла регистрацию через список ожидания. Стоимость использования сервиса или уровнях подписки пока неизвестны.
Pika Labs в сети Х

✔️ Microsoft разработала план борьбы с дипфейками.

Команда Microsoft по безопасности ИИ оценила 60 комбинаций методов верификации цифрового контента и опубликовала рекомендации для платформ и ИИ-компаний. Схема трёхуровневая: история происхождения файла, водяные знаки и цифровая подпись контента. Вместе они позволяют отследить, было ли изображение или видео создано или изменено ИИ, но не определить, правда ли это.

Главная ирония: когда CSO компании Эрик Хорвиц спросили, внедрит ли Microsoft собственные рекомендации в Copilot, LinkedIn и Azure, он ушёл от прямого ответа.

Эксперт по цифровой криминалистике из UC Berkeley Хани Фарид оценивает инициативу осторожно: стандарт не решит проблему целиком, но существенно усложнит массовый выброс фейков.
technologyreview.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
54👍33👏32🔥9🎉4🤔3😁2🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
💰 86-летний фермер из Пенсильвании отказался превращать свои поля в дата-центр для ИИ, даже за $15 млн.

Мервину Раудабо предложили около $60 000 за акр, но он не захотел уничтожать ферму, которую ведёт уже более 60 лет.

Вместо этого он продал права на застройку природоохранному фонду за $2 млн, теперь эта земля навсегда останется сельскохозяйственной.

«Вы генерируете текст.
Я генерирую ужин.»
Please open Telegram to view this post
VIEW IN TELEGRAM
291🔥67👍42👌33👏19😁13🤣138🤨3🤔1😢1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Anthropic запустила Claude Code Security.

Новый инструмент сканирует кодовую базу и предлагает патчи для исправления найденных проблем. Сейчас он доступен в режиме ограниченного превью для Enterprise и Team клиентов, а мейнтейнеры репозиториев могут запросить приоритетный бесплатный доступ.

Обычный статический анализ ищет совпадения с известными паттернами уязвимостей. Этого достаточно, чтобы поймать торчащие наружу пароли или устаревшее шифрование.

Но прорехи в бизнес-логике или сломанный контроль доступа такие инструменты пропускают - там нужно понимать, как компоненты взаимодействуют между собой и куда движутся данные.

Claude Code Security делает именно это: читает и анализирует код так, как его читал бы человек-исследователь безопасности.

Каждая находка проходит многоступенчатую верификацию. Claude сам перепроверяет результаты, пытаясь опровергнуть собственные выводы и отсеять ложные срабатывания.

Финальные находки появляются в дашборде с оценкой серьезности и уровнем уверенности модели. Решение, применять предложенный патч или нет остается за людьми, без человеческого одобрения ничего не меняется.

За инструментом - более года исследований. Команда Frontier Red Team тестировала Claude на соревнованиях CTF и совместно с Pacific Northwest National Laboratory отрабатывала защиту критической инфраструктуры.

С Opus 4.6 команда обнаружила в open-source проектах более 500 уязвимостей, которые не замечали годами, несмотря на регулярный аудит.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72👏29👍2115🤔7🎉4👌2