AI for Devs – Telegram
AI for Devs
3.6K subscribers
143 photos
45 videos
106 links
По сотрудничеству пишите в личные сообщения канала.
Download Telegram
🆕 Instinct от Continue: будущее автоматического рефакторинга

Команда AI for Devs подготовила перевод статьи о том, как Continue обучила Instinct — открытую модель Next Edit для предсказания следующей правки кода.

Результат: даже если бы разработчик сразу знал нужную правку и выполнил её оптимальной последовательностью действий со скоростью 90 WPM, использование модели всё равно обеспечивало бы получение качественного изменения в 6,4 раза быстрее.


📚 Подробности на Хабр: https://habr.com/ru/articles/946286/
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥2
🫡 Еженедельный дайджест №2

Для тех, кто был слишком занят на неделе или просто пропустил некоторые посты, публикуем дайджест!

Статьи:
Будущее джунов в эпоху ИИ: угроза или шанс?
Почему языковые модели «галлюцинируют»
Хватит дообучать ИИ — дайте ему контекст
Архитектура LPU и будущее AI без задержек
Instinct от Continue: будущее автоматического рефакторинга

Новости:
Mistral AI привлекла 1,7 млрд евро при оценке 11,7 млрд

Опросы:
Когда ИИ-система совершает вредоносную ошибку, кто должен нести ОСНОВНУЮ ответственность?

Самыми популярными комментариями этой недели стали комментарии к статье "Хватит дообучать ИИ — дайте ему контекст" от пользователей @acc0unt:

Очередное нытьё про то, какие LLM плохие, и какие символьные методы из 1985 года хорошие.
Объясни тогда, почему LLM дают результаты, а символьные методы в ИИ сдохли ещё в 90-х?
Цепляться сейчас с отчаянием обречённого за провалившиеся 30 лет назад парадигмы ИИ - это тупо и бесполезно.


@ai_for_devs
👍32🔥2👏2
☠️ Ваш AI-ассистент уже слил ключи в облако?

Команда AI for Devs подготовила перевод статьи о том, как AI-ассистенты для написания кода одновременно ускоряют разработку и умножают риски.

Исследование Apiiro показало: 4-кратный рост скорости сопровождается 10-кратным ростом уязвимостей.

Вопрос открытый — готовы ли компании масштабировать не только продуктивность, но и риски?

📚 Подробности на Хабр: https://habr.com/ru/articles/946918/
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4🔥2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Вышла GPT-5-Codex: код-ревью, рефакторинг и агентные задачи

GPT-5-Codex — новая модель, оптимизированная для агентного программирования.

Codex умеет писать проекты с нуля, проводить код-ревью, находить критические баги и даже часами самостоятельно выполнять масштабные рефакторинги.

📚 Подробности на Хабр: https://habr.com/ru/articles/947328/
🔥7👍32
🔥 AI и подростки: где граница между безопасностью и свободой?

OpenAI собирается по-новому выстраивать баланс между приватностью, безопасностью и свободой пользователей — и в центре внимания подростки.

Об этом написал Сэм Альтман. Он объяснил, как компания принимает непростые решения: как защитить личные данные, дать взрослым больше свободы и при этом обезопасить несовершеннолетних.

Ключевые моменты:
* Приватность как у врача: переписки с AI должны быть защищены на уровне медицинской тайны. OpenAI продвигает это на уровне политики компании.
* Фокус на подростках: безопасность важнее свободы и приватности.
* Возрастная проверка: разрабатывают систему прогнозирования возраста, при сомнении — включают детский режим.
* Жёсткие правила: ChatGPT не будет вести флирт-диалоги с подростками, обсуждать самоубийства даже в художественном контексте; при угрозе жизни — будут уведомлять родителей или власти.

AI-чат становится чем-то средним между личным дневником и психотерапевтом. Решения OpenAI могут задать стандарт для всей индустрии — от этики до регулирования.

Полный пост Сэма Альтмана

#news@ai_for_devs
👍4🤔3🔥2
💡 Ваш ИИ-ассистент — это новое поколение компиляторов

Команда AI for Devs подготовила перевод статьи о том, как ИИ меняет саму суть программирования.

Автор сравнивает LLM с компиляторами и утверждает, что роль разработчиков постепенно смещается от написания кода к управлению архитектурой и обучению ИИ.

Как думаете, это угроза или эволюция профессии?

📚 Подробности на Хабр: https://habr.com/ru/articles/948384/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3🤔21
🦜 Grok 4 Fast — новая модель от xAI

Новая модель от xAI сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.

📚 Подробности на Хабр: https://habr.com/ru/articles/948878/
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥2
🫡 Еженедельный дайджест №3

Для тех, кто был слишком занят на неделе или просто пропустил некоторые посты, публикуем дайджест!

Ваш AI-ассистент уже слил ключи в облако?
Вышла GPT-5-Codex: код-ревью, рефакторинг и агентные задачи
AI и подростки: где граница между безопасностью и свободой?
Ваш ИИ-ассистент — это новое поколение компиляторов
Grok 4 Fast — новая модель от xAI

Самыми популярными комментариями этой недели стали комментарии к статье "Ваш ИИ-ассистент — это новое поколение компиляторов" от пользователей @JerryI:

Типичный американский стиль: куча buzz, громкие заявление, ничего по факту. Поставил бы минус автору (но не переводчику!)


@ai_for_devs
3👍3🔥1
😬 Поздно пить Боржоми? Stack Overflow пробует в AI

Команда AI for Devs решила написать эту статью после выхода очередного продукта от Stack Overflow, в чьём имени красуется "AI".

Когда-то платформа запрещала любой ИИ-контент, потом осторожно тестировала инструменты вроде OverflowAI и Question Assistant, а теперь явно строит стратегию вокруг искусственного интеллекта.

📚 Подробности на Хабр: https://habr.com/ru/articles/948838/
👍4🔥21😁1
🔥 Вышла Qwen3-Omni

– и это уже не «ещё один текстовый чатик», а реально универсальный зверь: понимает текст, картинки, аудио и даже видео. Причём отвечает не только в тексте, но и голосом — почти как ваш личный Jarvis

Фишка в том, что это не костыль «натянем картинки поверх текста», а изначально мультимодальная архитектура. Китайцы хвастаются, что модель держит SOTA на 32 из 36 бенчмарков по аудио и видео, и по качеству догоняет Gemini 2.5 Pro. Плюс работает с 119 языками (да, и с русским тоже), а голос может выдать на 10 языках.

Под капотом — новая схема «Thinker–Talker»: один модуль думает, другой говорит. Звучит как хороший тандем для собеседования. Плюс MoE и хитрые оптимизации, чтобы отклик был в реальном времени.

Моё мнение? Ну, Omni — это заявка на «универсальный интерфейс ко всему». Уже умеет описывать музыку, переводить речь, отвечать на вопросы по видео и даже анализировать смешанные аудиотреки. Если Alibaba не похоронит проект под собственным весом, то это реальный кандидат на статус «второго GPT-4o».

GitHub
Демо на Hugging Face
👍4🔥4🤩21
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Notion объявил о крупнейшем обновлении за всю историю — Notion 3.0

Главный герой релиза — AI-агенты, которые теперь могут выполнять реальные рабочие задачи прямо внутри вашего воркспейса.

Агент умеет почти всё то же, что и вы: создавать документы, обновлять базы данных, искать информацию по всем инструментам, собирать отчёты и выполнять многошаговые процессы. Например, его можно попросить «собрать обратную связь из Slack, почты и Notion, оформить её в таблицу и подготовить выводы» — и результат появится без вашего участия.

Особенность в том, что агента можно персонализировать: задать ему инструкции по стилю работы, правила обработки задач и даже «характер». Более того, вскоре появится возможность создавать целые команды кастомных агентов — один будет вести проектные апдейты, другой готовить онбординг для новичков, третий заниматься поддержкой.

По сути, Notion перестаёт быть просто «умным блокнотом» и превращается в универсальную рабочую платформу, где рутинные процессы берут на себя агенты. Это обещает заметно сократить время на «мелкую текучку» и оставить больше ресурса для действительно важных задач.

Подробнее читайте на Хабре: https://habr.com/ru/news/949848/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥21
😲 Почему я не верю в ИИ-агентов в 2025 году, несмотря на то, что сам их разрабатываю

Несмотря на шумиху, «автономные агенты» столкнутся с экономическими и техническими барьерами.

Почему текущий подход к архитектуре агентов не сработает и какие методы действительно приносят результат — читайте в статье.

📚 Подробности на Хабр: https://habr.com/ru/articles/950072/
👍6🔥31
🔥 Вышла Code World Model: новая модель для кодинга

Meta (признана экстремистской и запрещена в РФ) выкатила Code World Model (CWM) — LLM на 32 млрд параметров, которая не просто предсказывает следующую строчку кода, а учится понимать, как код исполняется. Впервые модель массово тренировали не только на исходниках, но и результатах выполнения Python-кода и взаимодействии с Docker-средами — по сути, научили её играть в программиста, который пишет, запускает, дебажит и фиксит баги.

Главная идея: обычные кодовые LLM знают синтаксис, но плохо понимают семантику — что реально произойдёт при запуске. CWM пытается это исправить: она симулирует исполнение кода построчно, строит «ментальную модель» переменных и состояния программы, а потом использует это при генерации. Плюс её тренировали с помощью агентных задач (модель сама исследует репозиторий, правит баги и гоняет тесты).

Обучали модель в несколько этапов:

1. Pre-training – на 8T токенов из разных источников, включая код и STEM-данные.
2. Mid-training с моделированием мира — модель обучается на данных, которые включают реальные трассировки Python-кода и агентные взаимодействия с Docker. Тут происходит основное обучение на том, как исходный код влияет на переменные в реальном времени.
3. Supervised Fine-Tuning – на 100T токенов для улучшения способности решать задачи и следовать инструкциям.
4. Обучение с подкреплением (RL) — финальный этап, где модель решает задачи из реального мира, например, багфиксинг и решение математических задач.

Результаты в сравнении с другими моделями на картинке. Модель не достигает уровня GPT-5 и Sonnet 4, но вполне уверенно обходит GPT-oss и последний R1.

Источник | Веса | GitHub
🔥5👍32
AI уже почти готов заменить бухгалтеров, инженеров и юристов — но не спешите увольнять всех.

OpenAI представил GDPval — новую систему оценки, которая измеряет, насколько хорошо ИИ справляется с реальными рабочими задачами. Вместо абстрактных тестов и синтетических задач, теперь мы можем проверить, насколько хорошо модель справится с тем, что делают люди каждый день: от разработки ПО до написания юридических документов и проектирования оборудования.

GDPval охватывает 44 профессии из 9 ключевых отраслей экономики США — от инженеров и врачей до бухгалтеров и риэлторов. Каждая задача создана реальными экспертами и включает не просто текстовый запрос, но и реальные файлы, контекст и ожидаемые результаты — будь то презентация, чертеж или медицинский план. Это первый шаг к тому, чтобы ИИ не просто «умел» отвечать на вопросы, но и действительно делал работу.

Результаты? Современные модели уже почти не уступают экспертам. Claude Opus 4.1 выиграл в эстетике и оформлении, GPT-5 — в точности и глубине знаний. А главное: модели работают в 100 раз быстрее и дешевле. Конечно, пока без человеческого контроля и итераций, но прогресс явно идёт.

Примечательно, что от GPT-4o до GPT-5 за год производительность на задачах GDPval увеличилась более чем в три раза.

Как видно из графиков, паритет с экспертами в индустрии по отдельно взятым специальностям уже очень близко. Но это только начало. GDPval пока одноразовая оценка — не учитывает обратную связь, редактирование и уточнения. В реальности работа — это не один запрос, а диалог. OpenAI уже работает над этим. Ждём ИИ, который не просто отвечает, но и развивается вместе с человеком.

Источник
Полноценное исследование
👍4🔥3🤯31