Forwarded from Rust
🦀 Strand-Rust-Coder-14B - модель, заточенная специально под генерациию Rust кода.
Это не универсальный «кодинг-ассистент».
Модель дообучена именно на экосистеме Rust и пишет код на уровне опытного разработчика:
- идиоматичный Rust
- безопасная работа с памятью
- корректные async и ownership-паттерны
- акцент на производительность и системные задачи
Большинство моделей хорошо знают Python и JavaScript, но часто «путаются» в borrow checker, lifetimes и сложных Rust-конструкциях.
Strand-Rust-Coder решает именно эту проблему - фокус на системном программировании, low-level задачах и performance-critical приложениях.
https://huggingface.co/Fortytwo-Network/Strand-Rust-Coder-14B-v1
@rust_code
Это не универсальный «кодинг-ассистент».
Модель дообучена именно на экосистеме Rust и пишет код на уровне опытного разработчика:
- идиоматичный Rust
- безопасная работа с памятью
- корректные async и ownership-паттерны
- акцент на производительность и системные задачи
Большинство моделей хорошо знают Python и JavaScript, но часто «путаются» в borrow checker, lifetimes и сложных Rust-конструкциях.
Strand-Rust-Coder решает именно эту проблему - фокус на системном программировании, low-level задачах и performance-critical приложениях.
https://huggingface.co/Fortytwo-Network/Strand-Rust-Coder-14B-v1
@rust_code
1👍85🔥21❤12👏11💯5🤔3😁2
⚡️ VK внедряет VLM в поиск VK Видео
VK начала внедрение визуально-языковых моделей в поисковые системы своих продуктов. Технология уже работает в VK Видео. Теперь система анализирует не только название и описание ролика, но и сами кадры, звук и видеоряд.
Тестирование гипотез ускорилось в 5 раз, новые улучшения внедряются заметно быстрее, а поиск будет развиваться динамичнее.
Технология также усилит векторный поиск. Система будет опираться не только на семантическое совпадение слов, но и на реальное содержание видео через анализ аудио и визуальных признаков.
Подобные мультимодальные подходы развивают Microsoft, Google и TikTok. Обновление поэтапно появится и в других сервисах VK.
@ai_machinelearning_big_data
#news #ai #ml #VK
VK начала внедрение визуально-языковых моделей в поисковые системы своих продуктов. Технология уже работает в VK Видео. Теперь система анализирует не только название и описание ролика, но и сами кадры, звук и видеоряд.
Тестирование гипотез ускорилось в 5 раз, новые улучшения внедряются заметно быстрее, а поиск будет развиваться динамичнее.
Технология также усилит векторный поиск. Система будет опираться не только на семантическое совпадение слов, но и на реальное содержание видео через анализ аудио и визуальных признаков.
Подобные мультимодальные подходы развивают Microsoft, Google и TikTok. Обновление поэтапно появится и в других сервисах VK.
@ai_machinelearning_big_data
#news #ai #ml #VK
1🤣98👍73🔥20👏8🥱7🤷♂5🗿5😁2🤔2🌚2😴1
Forwarded from Анализ данных (Data analysis)
⚡️ Релиз Gemini 3.1 Pro - новый уровень интеллекта моделей
Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2.
- Резкий скачок качества
Результат почти в 2 раза выше, чем у предыдущей версии
- Обгоняет конкурентов
Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление
- Сильнее в реальных сценариях
- программирование
- агентные задачи
- работа с новыми паттернами без примеров
- Новые возможности
Модель может генерировать анимированные SVG из текста и решать логические задачи, которых не было в обучающей выборке — это важный шаг к более универсальному AI.
Попробовать Gemini 3.1 Pro уже можно в Google AI Studio: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
@ai_machinelearning_big_data
Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2.
- Резкий скачок качества
Результат почти в 2 раза выше, чем у предыдущей версии
- Обгоняет конкурентов
Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление
- Сильнее в реальных сценариях
- программирование
- агентные задачи
- работа с новыми паттернами без примеров
- Новые возможности
Модель может генерировать анимированные SVG из текста и решать логические задачи, которых не было в обучающей выборке — это важный шаг к более универсальному AI.
Попробовать Gemini 3.1 Pro уже можно в Google AI Studio: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
@ai_machinelearning_big_data
1🔥126❤39⚡38👍12🤩11🙊10😴9🤷♂6👏6🌭5🙈5
Media is too big
VIEW IN TELEGRAM
Команда Nerve переходит в OpenAI в рамках сделки формата acqui-hire. Технологии стартапа будут интегрированы в существующие продукты OpenAI для улучшения механизмов поиска на рабочих местах.
До поглощения Nerve работала как единый хаб. Система умела извлекать данные из корпоративных документов, электронной почты, Google Drive и Slack, заменяя рутинный ручной поиск автоматизированными сценариями.
Наработки Nerve станут инфраструктурным компонентом для создания будущих ИИ-агентов, способных самостоятельно оперировать корпоративной информацией и выполнять сложные многошаговые задачи.
usenerve.com
Китайская корпорация активно нанимает инженеров и исследователей в Сан-Хосе, Лос-Анджелесе и Сиэтле для лаборатории Seed.Перед кандидатами ставятся задачи по подготовке датасетов для LLM, улучшению алгоритмов генерации видео и изображений, а также разработка научных моделей для дизайна лекарственных препаратов.
Отдельный фокус сделан на проекте Seed Edge Research, цель которого в создании систем с человекоподобными способностями к обучению.
Агрессивный наем происходит на фоне многолетнего давления американских регуляторов. Несмотря на это, ByteDance явно не планирует уступать технологическую гонку и усиливает свои R&D-центры на территории конкурентов.
bloomberg.com
В рамках проекта Project Silica инженеры решили фундаментальную проблему деградации носителей в дата-центрах. В Nature вышла статья о важном сдвиге: команда отказалась от дорогого чистого кварца в пользу доступного боросиликатного стекла. Фемтосекундные лазеры "прожигают" в пластине толщиной 2 мм сотни слоев информации
Фишка исследования — изобретение «фазовых вокселей». Раньше методы опирались на поляризацию, а новый подход изменяет фазу стекла и требует лишь одного лазерного импульса на воксель. Чтобы разобрать эту плотную трехмерную структуру и убрать искажения, Microsoft подключила нейросети. Скорость записи подняли, запустив несколько лучей параллельно, а само устройство упростили: теперь для чтения хватает одной камеры вместо четырех.
Стеклянный носитель не боится воды, высоких температур и пыли. Тесты на старение подтвердили, что записанная информация останется неизменной минимум несколько тысячелетий. На этом исследовательская часть Project Silica закончена. Технология готова, теперь на ее основе можно строить хранилища.
microsoft.com
Новая функция Photoshoot - часть маркетинговой платформы Pomelli. Инструмент ориентирован на малый и средний бизнес, он превращает через Nano Banana фотографии товаров в качественные студийные и лайфстайл-кадры без затрат на продакшен.
Платформа автоматически парсит сайт компании, извлекает фирменные цвета, шрифты и общую эстетику бренда для применения к генерируемому контенту. Сервис предлагает готовые визуальные пресеты, замену фона по текстовому запросу и перенос стиля с референсов. Пока это бесплатная бета, но только для США, Канады, Австралии и Новой Зеландии.
blog.google
Phoenix-4 покадрово генерирует каждый пиксель лица и головы виртуального собеседника, опираясь на датасет из тысяч часов реальных диалогов.
Киллер-фича Phoenix-4 в способности анализировать контекст беседы и демонстрировать эмпатию. Модель знает более 10 эмоций и умеет плавно переключаться между ними в реальном времени. Разработчики заверяют, что тем самым победили эффект «зловещей долины».
Технически все серьезно: HD-видео, 40 кадров в секунду. Tavus предлагает использовать это в продажах, обучении и медицине - там, где человеку важно внимание.
tavus.io
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
7❤63👍52🔥15👏4🌚3🥰2
Создатели Claude проанализировали миллионы взаимодействий в Claude Code и через публичный API с помощью их инструмента Clio, чтобы понять, сколько автономии люди реально дают агентам, в каких доменах те работают и насколько рискованны их действия.
За 3 месяца медианная длина самых долгих сессий в Claude Code почти удвоилась - с 25 до более чем 45 минут непрерывной работы. Причем рост плавный и не коррелирует с релизами новых моделей.
Это значит, что дело не только в возможностях модели, а в том, как пользователи выстраивают взаимодействие с агентом.
Среди тех, кто только начинает пользоваться Claude Code, около 20% сессий запускают с полным авто-апрувом, это когда агент выполняет все действия без подтверждений.
У опытных пользователей эта доля больше 40%. Плюс они чаще прерывают агента вручную.
Аnthropic предполагает, что это не потому, что теряется доверие, а потому что они берутся за более сложные задачи и лучше понимают, когда нужно вмешаться.
На самых сложных задачах Claude Code останавливается и задает уточняющий вопрос вдвое чаще, чем по принудительному прерыванию человеком.
Почти половина всей агентной активности через API - за разработкой ПО.
Есть прирост использования в медицине, финансах и кибербезопасности, но пока в небольших объемах.
По итогу исследования, Аnthropic пришла к выводу, что эффективный надзор за агентами требует не только технических ограничений, но и новой инфраструктуры пост-деплойного мониторинга и новых паттернов взаимодействия - где и человек, и агент совместно управляют автономией и рисками.
Текущие модели, по данным компании, технически способны на большую самостоятельность, чем им позволяют на практике.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🤔61👏45💋40😎28😢27🤣23🎉22❤19🫡16👨💻15
AI уже не запрещают на собеседованиях – его требуют
В Циане изменили подход к найму: кандидатам в Product & Technology и HR рекомендуют выполнять тестовые задания и live coding с помощью AI-ассистентов.
Компания оценивает не только результат, но и то, как человек работает с AI:
- качество взаимодействия с инструментом
- скорость решения задач
- умение проверять и дорабатывать ответы
- соблюдение принципов безопасного и этичного использования
Сегодня более 75% разработчиков в компании уже используют AI в работе.
По словам Максима Радюкова, директора по информационным технологиям Циана, владение AI-инструментами становится нормой рынка, а инвестиции в эти навыки – ключевым конкурентным преимуществом.
В планах – масштабировать подход на всех сотрудников.
Вывод
Раньше на собеседовании проверяли, умеешь ли ты кодить.
Теперь – умеешь ли ты эффективно работать вместе с AI.
AI перестаёт быть «читом» – он становится базовым рабочим инструментом.
В Циане изменили подход к найму: кандидатам в Product & Technology и HR рекомендуют выполнять тестовые задания и live coding с помощью AI-ассистентов.
Компания оценивает не только результат, но и то, как человек работает с AI:
- качество взаимодействия с инструментом
- скорость решения задач
- умение проверять и дорабатывать ответы
- соблюдение принципов безопасного и этичного использования
Сегодня более 75% разработчиков в компании уже используют AI в работе.
По словам Максима Радюкова, директора по информационным технологиям Циана, владение AI-инструментами становится нормой рынка, а инвестиции в эти навыки – ключевым конкурентным преимуществом.
В планах – масштабировать подход на всех сотрудников.
Вывод
Раньше на собеседовании проверяли, умеешь ли ты кодить.
Теперь – умеешь ли ты эффективно работать вместе с AI.
AI перестаёт быть «читом» – он становится базовым рабочим инструментом.
👍88🤝40😁28❤7👏6🤔6🔥5👨💻5👾3🎅2🥰1
SkillsBench — исследование и первый бенчмарк, где Agent Skills тестируются как самостоятельный артефакт.
Авторы из 15+ топовых университетов взяли 84 задачи из 11 доменов, запустили 7 конфигураций моделей (Claude Code с Opus/Sonnet/Haiku 4.5 и 4.6, Gemini CLI с Gemini 3 Pro/Flash, Codex с GPT-5.2) и проверили 3 условия: без Skills, с готовыми Skills и с самостоятельно сгенерированными Skills. Итого: 7 308 траекторий с детерминированными верификаторами на pytest.
Готовые Skills в среднем поднимают pass rate на 16,2 процентных пункта: с 24,3% до 40,6%. Но картина неоднородная: в медицине прирост составил +51,9%, для производства — +41,9%, тогда как в разработке ПО всего +4,5%.
Это объяснимо: там, где модели плохо покрыты обучением (клинические протоколы, промышленные воркфлоу), Skills дают максимальный эффект. Там, где модель и так знает домен - почти ничего.
Когда моделям предлагали сначала написать нужные гайды, а потом решать задачу, средний результат упал на 1,3% по сравнению с работой вообще без Skills. Только Claude Opus 4.6 показал скромный плюс (+1,4%), а GPT-5.2 просел на 5,6%.
Иными словами - модели не умеют надежно создавать то знание, которым умеют пользоваться.
Оптимальный вариант: 2–3 модуля, прирост +18,6%. При 4 и более - всего +5,9%. Подробная документация вообще дает отрицательный эффект: –2,9%, с ней агент буквально тонет в контексте.
Показательна и стоимость решения задач: Haiku 4.5 со Skills обходит Opus 4.5 без Skills — меньшая и более дешевая модель с готовыми Skills бьет старшую модель без них.
Gemini 3 Flash при этом показал лучший абсолютный результат среди всех конфигураций - 48,7% со Skills при цене $0,57 за одну задачу против $1,06 у Gemini 3 Pro.
@ai_machinelearning_big_data
#AI #ML #LLM #Benchmark #Skills
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🤓45❤18🤔9👏8❤🔥6👌5🔥1🥰1
Media is too big
VIEW IN TELEGRAM
Компания готовит к запуску линейку фирменных гаджетов. Первым устройством станет умная колонка. Ее релиз ожидается не раньше февраля 2027 года по цене от 200 до 300 долларов.
Фишкой гаджета станет встроенная камера с функцией распознавания лиц. Устройство сможет анализировать происходящее вокруг и давать проактивные советы. Производство аппаратных новинок планируют поручить компании Foxconn.
Колонка станет отправной точкой для новой экосистемы. В разработке также находятся умные очки (старт производства в 2028 гоу), беспроводная гарнитура Sweetpea, умный стилус Gumdrop и прототип настольной лампы.
theinformation.com
Георгий Герганов и его команда переходят в Hugging Face. Проект llama.cpp останется полностью открытым и независимым. Разработчики сохранят за собой техническое руководство, а Hugging Face обеспечит финансирование и ресурсы.
Цель партнерства - техническая интеграция. Поскольку transformers де-факто стала стандартом для архитектур ИИ-моделей, а llama.cpp выступает фундаментом для их локального инференса, команды хотят максимально упростить связку этих инструментов. В будущем развертывание новых моделей из transformers в llama.cpp должно работать в один клик.
Также планируется улучшить упаковку и общий пользовательский опыт архитектуры GGML. Hugging Face делает ставку на то, что локальный инференс вскоре станет альтернативой облачным вычислениям.
huggingface.co
Anthropic выпустила официальную интеграцию ИИ-ассистента для Microsoft PowerPoint. Плагин уже появился в Microsoft Marketplace и доступен в статусе бета-версии для подписчиков тарифов Pro, Max, Team и Enterprise.
Через Claude можно генерировать целые презентации или править отдельные слайды с помощью текстовых запросов. Чат-бот понимает контекст текущего дизайна - он умеет считывать макеты, шрифты и цветовую палитру из образца слайдов. Таким образом, все новые элементы и сгенерированный контент автоматически подстраиваются под корпоративный стиль или существующее оформление документа.
claude.com
Новая функция AI Selves позволит развернуть виртуального двойника, который обладает памятью, уникальным характером и способен самостоятельно общаться с другими людьми. За мимику и артикуляцию при разговоре отвечают собственные аудиовизуальные модели лаботатории.
Пользователи смогут детально настраивать свою копию: задавать голос, манеру общения и загружать конкретные факты биографии или личные предпочтения. Процесс напоминает воспитание аватара, где создатель несет ответственность за заложенные в ИИ инструкции. Предполагается, что такие агенты будут интегрированы в мессенджеры и соцсети, где смогут общаться и действовать от имени пользователя.
Pika Labs открыла регистрацию через список ожидания. Стоимость использования сервиса или уровнях подписки пока неизвестны.
Pika Labs в сети Х
Команда Microsoft по безопасности ИИ оценила 60 комбинаций методов верификации цифрового контента и опубликовала рекомендации для платформ и ИИ-компаний. Схема трёхуровневая: история происхождения файла, водяные знаки и цифровая подпись контента. Вместе они позволяют отследить, было ли изображение или видео создано или изменено ИИ, но не определить, правда ли это.
Главная ирония: когда CSO компании Эрик Хорвиц спросили, внедрит ли Microsoft собственные рекомендации в Copilot, LinkedIn и Azure, он ушёл от прямого ответа.
Эксперт по цифровой криминалистике из UC Berkeley Хани Фарид оценивает инициативу осторожно: стандарт не решит проблему целиком, но существенно усложнит массовый выброс фейков.
technologyreview.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤54👍33👏32🔥9🎉4🤔3😁2🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
Мервину Раудабо предложили около $60 000 за акр, но он не захотел уничтожать ферму, которую ведёт уже более 60 лет.
Вместо этого он продал права на застройку природоохранному фонду за $2 млн, теперь эта земля навсегда останется сельскохозяйственной.
«Вы генерируете текст.
Я генерирую ужин.»
Please open Telegram to view this post
VIEW IN TELEGRAM
❤291🔥67👍42👌33👏19😁13🤣13☃8🤨3🤔1😢1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый инструмент сканирует кодовую базу и предлагает патчи для исправления найденных проблем. Сейчас он доступен в режиме ограниченного превью для Enterprise и Team клиентов, а мейнтейнеры репозиториев могут запросить приоритетный бесплатный доступ.
Обычный статический анализ ищет совпадения с известными паттернами уязвимостей. Этого достаточно, чтобы поймать торчащие наружу пароли или устаревшее шифрование.
Но прорехи в бизнес-логике или сломанный контроль доступа такие инструменты пропускают - там нужно понимать, как компоненты взаимодействуют между собой и куда движутся данные.
Claude Code Security делает именно это: читает и анализирует код так, как его читал бы человек-исследователь безопасности.
Каждая находка проходит многоступенчатую верификацию. Claude сам перепроверяет результаты, пытаясь опровергнуть собственные выводы и отсеять ложные срабатывания.
Финальные находки появляются в дашборде с оценкой серьезности и уровнем уверенности модели. Решение, применять предложенный патч или нет остается за людьми, без человеческого одобрения ничего не меняется.
За инструментом - более года исследований. Команда Frontier Red Team тестировала Claude на соревнованиях CTF и совместно с Pacific Northwest National Laboratory отрабатывала защиту критической инфраструктуры.
С Opus 4.6 команда обнаружила в open-source проектах более 500 уязвимостей, которые не замечали годами, несмотря на регулярный аудит.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72👏29👍21❤15🤔7🎉4👌2