ген ИИ – Telegram
ген ИИ
2.92K subscribers
1.74K photos
154 videos
27 files
776 links
привет, я Алексей Сидорюк, а это мой канал, посвященный новостям и ярким событиями генеративного ИИ. Делюсь опытом использования решений на базе ИИ, сценариями применения, которые экономят время, полезными инсайтами.

Для связи: @asidoryuk
Сайт: gen-ii.ru
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔥76👍5❤‍🔥1🦄1
Сбер опубликовал веса крупнейших open-source моделей в Европе

Сбер опубликовал веса нескольких моделей, включая флагманскую GigaChat Ultra Preview, GigaChat Lightning, семейство акустических моделей GigaAM-v3, а также Kandinsky 5.0 для генерации изображений и видео.

GigaChat 3 Ultra & Lightning Модель использует Mixture-of-Experts (MoE) с Multi-head Latent Attention (MLA) и Multi-Token Prediction (MTP). MLA сжимает KV-кэш в латентное представление, что снижает требования к памяти и ускоряет инференс для длинных контекстов (до 131к токенов). MTP позволяет модели предсказывать несколько токенов за шаг, ускоряя генерацию на ~40%. По бенчмаркам (MERA, MMLU, GSM8K) модель обходит предыдущие версии и конкурирует с DeepSeek V3.1.


GigaAM-v3 - это семейство акустических моделей для распознавания речи, оптимизированных под русский язык. Они показывают 30% улучшение WER на новых доменах (колл-центры, музыкальные запросы) по сравнению с предыдущими версиями. Модели поддерживают пунктуацию, нормализацию текста и даже распознавание эмоций (GigaAM-Emo). В сравнении с Whisper-large-v3, GigaAM выигрывает в side-by-side тестах с соотношением 70:30.


Kandinsky 5.0 - это семейство диффузионных моделей для генерации изображений и видео. В него входят:
Image Lite (6B параметров) - генерация изображений в HD с сильным пониманием русского контекста.
Video Pro (19B параметров) - генерация видео до 10 секунд в HD, конкурирующая с топовыми мировыми моделями.
Video Lite (2B параметров) - облегчённая версия для домашних видеокарт (от 12 ГБ памяти), которая обходит более крупные модели (например, Wan 5B и 14B) по качеству и скорости.


KVAE 1.0 - токенайзеры для изображений и видео, которые сжимают данные в латентное пространство, ускоряя работу генеративных моделей. KVAE-2D и KVAE-3D показывают лучшие метрики (PSNR, SSIM) по сравнению с аналогами (Flux, HunyuanVideo).


На практике:
Для бизнеса: GigaChat Ultra Preview и Lightning подходят для аналитики, RAG-систем и дообучения на своих данных. GigaAM-v3 можно интегрировать в голосовые ассистенты и контакт-центры.
Для исследователей: Kandinsky 5.0 и KVAE 1.0 открывают возможности для экспериментов с генерацией видео и оптимизацией инференса.
Для энтузиастов: Video Lite позволяет генерировать видео на домашних GPU, а Image Lite - создавать изображения с учётом русскоязычного контекста.

Сбер делает ставку на открытость: все модели доступны под MIT-лицензией, с поддержкой коммерческого использования. Это редкий случай, когда крупная компания предоставляет инструменты для реального применения - от голосовых ассистентов до генерации видео. Однако ключевой вопрос: насколько сообщество сможет поддержать и развивать эти модели, особенно учитывая их масштаб и требования к ресурсам.

#релиз

ген ИИ
❤‍🔥4👍3🔥2
Алексей Сидорюк, АФТ: Принципиальное изменение парадигмы применения искусственного интеллекта произошло в тот момент, когда многие процессы начали базироваться на ИИ и перестраиваться во взаимодействии с людьми.

«Искусственный интеллект бизнес применяет уже давно. Но раньше ИИ использовался как некая надстройка над процессами обслуживания клиентов. Зачастую там применялись и классические чат-боты, потом появилось классическое машинное обучение, сейчас уже применяются LLM-модели. А теперь мы видим, как ИИ трансформирует бизнес-процессы», — об этом рассказал советник генерального директора по ИИ Ассоциации ФинТех Алексей Сидорюк, открывая дискуссию «Переход от бизнес модели плюс-ИИ к ИИ-плюс. Как эффективно использовать AI, чтобы не отдаляться от клиентов?» в рамках форума CX FINTECH DAY. В подтверждение своих слов Алексей привел несколько цифр из исследований рынка ИИ 2024-2025 годов. Так, согласно совместному исследованию компаний «Яков и Партнеры» и Яндекс, внедрение ИИ может принести российской экономике 13 трлн рублей к 2030 году, а больше 90% финансовых организаций уже внедряют генеративный ИИ. Кроме этого, по данным АФТ 58% банков планируют автоматизировать до 70% клиентских взаимодействий с помощью LLM-агентов: это один из основных доменов, где в B2C-бизнесе применяется искусственный интеллект. Тем не менее, данные опросов показывают, что 15% людей раздражает общение с ИИ-ботами, а в целом 38-43% россиян все еще не доверяют ИИ (CNews, ВЦИОМ).

Директор продуктово‑инвестиционного офиса, лидер AI‑Native трансформации МТС Банка Борис Ашрафьян отметил, что для многих пользователей, особенно представителей молодого поколения, уже не имеет значения, кто оказывает услугу — живой человек или робот; важнее её качество. Современные чат‑боты способны поддерживать естественный диалог и учитывать настроение клиента. Поэтому при внедрении ИИ финтех-компаниям важно думать о том, как выстроить удобный и эффективный клиентский путь, сохранив при этом маржинальность бизнеса.

Вице-президент — руководитель Лаборатории финтеха и инноваций Страхового Дома ВСК Марина Ляшенко отметила, что внедрение ИИ должно стать стратегической задачей для компании, учитывать её зрелость, ресурсы, видение руководства по использованию технологий. При этом важно проводить работу системно и комплексно, контролировать внедрение на всех этапах с помощью метрик — проводить аккуратные, точечные, измеряемые эксперименты.

О преимуществах консервативной стратегии при внедрении искусственного интеллекта в финансах также заявил руководитель Лаборатории ИИ Департамента больших данных Россельхозбанка Даниил Потапов. Он отметил, что для долгосрочного успеха важно не гнаться за новинками на этапе их максимально дорогого и сложнопрогнозируемого внедрения, а планомерно выстраивать доверие к технологии. Даниил подчеркнул, что основной драйвер изменений в ближайшем будущем — активное внедрение ИИ-агентов. Они будут не только взаимодействовать между собой, но и решать стратегические задачи, сопровождая клиента на всех этапах, что значительно ускорит процессы и повысит общее доверие к технологии.

Директор по ИИ, академический руководитель первой в России онлайн-магистратуры по NLP и магистратуры по Data Science, ментор Академии ИИ Владимир Васильев подтвердил, что внедрение ИИ может сопровождаться существенными инвестициями, особенно при низком уровне технологической зрелости компании, поэтому топ-менеджмент на первом этапе часто принимает решение о точечном внедрении искусственного интеллекта там, где это приносит понятный для руководства финансовый эффект.

Но важно, что точечное внедрение не всегда улучшает клиентский опыт, а ограниченные инвестиции в ИИ часто ведут к ещё более ограниченным результатам.

Владимир подчеркнул, что в ближайшие 1-2 года произойдет переоценка финансовых эффектов от ИИ и, как следствие, степени влияния ИИ на бизнес-процессы крупных компаний, в результате чего мы сможем увидеть выход на плато ожиданий и даже снижение хайпа вокруг сферы ИИ в целом.
1🔥4❤‍🔥3👏3
Человечество проходит через пик разочарования в ген ИИ - и это нормальная стадия взросления технологии

В Ассоциации ФинТех завершается третья фаза пилотного проекта «Агент будущего» - тестирования ИИ-агентов и мультиагентных систем в российских банках и страховых компаниях. Я поделился промежуточными итогами: от первых экспериментов с отечественными GPT-моделями до автономных цифровых сотрудников, которые уже сегодня решают реальные бизнес-задачи. Но, как выяснилось, технология пока не оправдывает ожиданий в полной мере.

В первые две фазы (2023–2024) 10 финансовых организаций тестировали модели в роли «второй линии поддержки» - для автоматизации взаимодействия с клиентами, работы с документами (например, по льготной ипотеке) и распознавания текстов, где классические OCR-системы давали сбои. Однако не все гипотезы сработали. Например, применение моделей для анализа рыночных сигналов и трейдинга привело к слишком многим ложным срабатываниям - там, где опытные трейдеры просто игнорируют шум, ИИ реагировал на всё подряд.

В этом году проект перешёл на новый уровень: 20 организаций (примерно половина из них осталась лишь наблюдателями) тестируют полноценных ИИ-агентов - автономных «сотрудников», способных выполнять задачи без прямого запроса от пользователя. Среди самых интересных сценариев:
Архитектурный надзор: агенты сверяют код в продуктивной среде с архитектурной документацией и требованиями безопасности, выявляя несоответствия.
Конструирование финансовых продуктов: агенты помогают операционистам банков создавать персонализированные акты, счета и договоры под конкретных клиентов.
Работа с юридическими документами: автоматизация подготовки документов с учётом индивидуальных условий.

При этом переход в промышленную эксплуатацию тормозится не только техническими ограничениями. Даже у половины участников прошлого года, которые внедрили решения, возникают проблемы с информационной безопасностью и расширением инфраструктуры. Например, если данные в корпоративном контуре не обновлены, GPT-модель может работать с устаревшей информацией.

В будущем могут сказаться технологические ограничения. Механизм RAG, который сегодня используется для расширения контекста моделей, я называю «архитектурным костылём»: он помогает бороться с забывчивостью моделей, но увеличивает время отклика и не масштабируется на большое количество агентов. Другая проблема - кибербезопасность: традиционные модели ролевой аутентификации не работают с ИИ-агентами, и рынок постепенно переходит на ABAC-системы, где права выдаются на основе контекста задачи. Это требует пересмотра подходов к управлению доступом, особенно когда один ИИ-агент начинает управлять другим.

Ещё одна сложность - дефицит компетенций. Многие организации не готовы поддерживать открытые модели самостоятельно, а облачные сервисы для работы с чувствительной информацией по-прежнему под запретом. Ну и технологии развиваются гораздо быстрее, чем успевает адаптироваться рынок труда.

Что значит AI-native финансовая организация для пользователя? Массовые клиенты получат доступ к сервисам, которые раньше были доступны только привилегированным, в перспективе 2-3 лет. А пока основной эффект ИИ-агенты приносят внутри компаний - автоматизируя рутинные задачи сотрудников.

В ближайшие годы мы планируем развивать ещё два направления:
1. Валидация финансовых продуктов вместе с Банком России: ИИ будет анализировать договоры и формировать краткие резюме, снижая барьер финансовой грамотности для клиентов.
2. Этика ИИ в финансах: совместный комитет с Альянсом в сфере ИИ займётся разработкой стандартов ответственного использования технологий.

#мнение

ген ИИ
👍64🔥4
Самые значимые релизы и продукты ген ИИ 2025 года

2025 год стал моментом, когда генеративный ИИ перестал быть «чат-ботом» и стал полноценным участником рабочих процессов. Мы перестали просить нейросети «написать», мы начали поручать им «сделать».

Вот ключевые продукты года, реально изменившие рынок:

1. Агенты и Автономность
Стоит обратить внимание: Manus
Это первый массовый Generalist Agent, который работает по принципу «поставил цель - получил результат». В отличие от чат-ботов, Manus сам управляет браузером, пишет код, бронирует билеты и составляет отчеты в формате Code-Act.
Почему это важно: Он показал рабочую модель целеориентированного ИИ, который действует. Именно поэтому 2025 год часто описывают как начало сдвига от LLM к Large Action Models - моделям, встроенным в действия и процессы.
Альтернативы: Multi-Agent Frameworks (AutoGPT 2.0), корпоративные AI-оркестраторы. Но по «айдентике» Manus - главный референс года.

2. Код и Разработка
Стоит обратить внимание: Cursor (с функцией Agent / YOLO Mode).
В 2025 году Cursor перестал быть просто «редактором с AI» и стал автономным разработчиком. Режим YOLO Mode (разрешение на самостоятельные правки без подтверждения каждой строки) позволил ему рефакторить целые модули и исправлять баги в фоновом режиме.
Альтернатива: GitHub Copilot Workspace - силен своей экосистемой, но в 2025 году воспринимается как более консервативное корпоративное решение.

3. Текст и Мышление
Стоит обратить внимание: ChatGPT (GPT-5).
Оформился как когнитивная платформа. Главная фича - Reasoning (глубокое рассуждение). Модель теперь умеет «думать» перед ответом (System 2 thinking), что критично для науки, юриспруденции и сложной логики.
Альтернатива: Claude 4.1 Opus (Anthropic) - остается эталоном для написания больших текстов и работы с огромным контекстом.

4. Генерация изображений
Стоит обратить внимание: Nano Banana (Google Gemini Image 3).
Продукт, который сделал Google лидером генеративки. «Нано Банан» решил главную боль - редактируемость. Он понимает 3D-сцену, свет и физику объектов, позволяя менять детали, не ломая композицию.
Альтернатива: Midjourney v7 - всё ещё король «художественного» стиля, но проигрывает в точности управления.

5. Видео и Аватары
Стоит обратить внимание: Sora (OpenAI) / Veo (Google).
Обеспечили физически правдоподобное видео (симуляция гравитации, света).
Цифровые люди: HeyGen. Стал стандартом для видео-коммуникации (цифровые двойники, которые говорят на любом языке с вашим голосом и липсинком).

6. Работа со знаниями
Стоит обратить внимание: NotebookLM.
Превратил скучные PDF в диалоги и Audio Overviews (подкасты), изменив способ потребления информации. Студенты и аналитики теперь «слушают» документы.
Альтернатива: Perplexity - стандарт для быстрого фактчекинга и поиска.

🇷🇺 Россия: Суверенный стек и экосистемы
Российский рынок в 2025 году сфокусировался на безопасности, суверенности и формировании собственных закрытых экосистем.

GigaChat MAX и YandexGPT 5 - закрыли базовые потребности, обеспечив работу с русским языком на уровне мировых лидеров.
Сбер (Open Source) - совершил смелый ход, выложив свои ключевые продукты в открытый доступ под лицензией MIT, разрешающей коммерческое использование. Это дало мощный импульс для локальных стартапов, которые теперь могут бесплатно строить продукты на базе SOTA-моделей.
MWS AI (МТС) - фокус на enterprise-сегменте. Запустили платформу AI Agents для создания мультиагентных систем без кода (NoCode/LowCode). Это позволяет бизнесу собирать сложные сценарии из готовых блоков внутри закрытого контура, не отправляя данные «наружу».
Т-Банк в конце года выложил в открытый доступ ризонинг модель T-pro 2.0, которая является лучшей моделью в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству.

Напишите в комментариях, что для вас стало прорывным продуктом или релизом в 2025 году?

#итоги

ген ИИ
15👏4🎉3
Итоги 2025: тренды ИИ от Яндекса

Продолжаем подводить итоги уходящего года. Сегодня разберём, что написал Яндекс в своём обзоре о главных трендах ИИ в 2025-м. Ключевые тренды:

1. ИИ-агенты: от пилотов к массовому внедрению
В 2025 году ИИ-агенты перестали быть игрушкой для энтузиастов. Компании начали внедрять их в реальные бизнес-процессы: от обработки обращений в метро до автоматизации работы контакт-центров. Например, Московский метрополитен сократил количество письменных обращений на 35% благодаря ИИ-помощнику «Александру», а «Лемана ПРО» снизила стоимость создания карточек товаров на 95%.

Московский метрополитен сократил количество письменных обращений на 35% благодаря ИИ-помощнику «Александру», а «Лемана ПРО» снизила стоимость создания карточек товаров на 95%.

2. Новые большие языковые модели: разнообразие как преимущество
Универсальной модели не существует - каждая задача требует своего инструмента. В 2025 году Яндекс предоставил доступ к более чем 20 моделям, включая Qwen3-235b и Alice AI LLM. Последняя, кстати, на 60% эффективнее конкурентов в бизнес-сценарных задачах.

Разнообразие моделей позволяет бизнесу выбирать оптимальные решения под конкретные задачи. Например, страховая компания «Ренессанс Жизнь» сократила обработку документов с нескольких дней до 20–30 секунд, а «Золотое Яблоко» повысило средний чек на 8% благодаря персонализации дизайна подарочных карт.

3. Вайб-кодинг: когда ИИ пишет код
Термин «вайб-кодинг» стал словом года по версии Collins, и не случайно. Кодовые ассистенты, такие как GitHub Copilot, используются миллионами разработчиков. Яндекс пошёл дальше - в SourceCraft появился агентский режим, где ИИ управляет полным циклом разработки: от создания репозитория до развёртывания.

60% разработчиков используют агентский режим SourceCraft Code Assistant для генерации и рефакторинга кода, 15% - для проектирования архитектуры, ещё 15% - для поиска информации в базах знаний.

4. MCP-протокол: экосистема для агентов
Model Context Protocol (MCP) стал стандартом интеграции ИИ-агентов с внешними системами. Яндекс поддержал его в Yandex AI Studio, что позволило интегрировать агенты с amoCRM, «Контур.Фокус» и другими сервисами. Это шаг к созданию единой экосистемы, где агенты могут работать совместно, обмениваясь данными и задачами.

Яндекс поддержал его в Yandex AI Studio, что позволило интегрировать агенты с amoCRM, «Контур.Фокус» и другими сервисами.

5. ИИ-фабрики: инфраструктура масштабируется
Без мощной инфраструктуры развитие ИИ невозможно. Новые дата-центры позволяют обучать и запускать модели быстрее и эффективнее, что критично для бизнеса.

ИИ требует мощностей, и в 2025 году Яндекс анонсировал новый дата-центр во Владимирской области. Он обеспечит задержку менее 1 мс и пропускную способность до 25,6 Тбит/с. Это основа для масштабирования ИИ-решений.

6. ИИ для защиты от ИИ-атак
ИИ становится инструментом как для злоумышленников, так и для защитников. Важно не только развивать технологии, но и создавать механизмы безопасности, способные противостоять новым угрозам.

В 2025 году кибератаки с использованием ИИ стали реальностью. Яндекс внедрил мультиагентную систему в SOC, которая автоматизирует 39% рутины и сокращает ложные срабатывания на 86%. Это пример того, как ИИ используется не только для атаки, но и для защиты.


7. Безопасная разработка ИИ
Яндекс представил AI-SAFE Framework - руководство по безопасной разработке ИИ-агентов на основе практик OWASP, NIST и MITRE ATT&CK. Это первый в России комплексный подход к защите агентских систем.

Безопасность ИИ - необходимость. Чем больше ИИ интегрируется в бизнес, тем выше риски. Framework помогает минимизировать их на всех этапах - от разработки до эксплуатации.

#итоги

ген ИИ
👍4❤‍🔥2🔥21
Как Россия готовит ИИ-кадры

В свежем исследовании J'son & Partners Consulting разбирается, как Россия адаптирует подготовку специалистов по искусственному интеллекту под быстро меняющиеся требования рынка. В материале приведены и мои комментарии.

Основная идея исследования:
в отличие от США и Китая, где ключевую роль играют университеты или государственное регулирование, в России ставка сделана на партнёрство бигтеха, вузов и государства. Это система, которая формировалась ещё до бума ИИ и теперь позволяет быстро реагировать на запросы рынка.

Что важно в этом подходе:

1. Гибкость через практику. Крупные IT-компании не просто участвуют в образовательных программах - они формируют их стандарт. Например, ещё 10 лет назад бигтех начал создавать собственные образовательные проекты по анализу данных и машинному обучению. Сейчас это стало массовой практикой: компании запускают программы, привлекают своих специалистов в качестве преподавателей, а студенты получают не только знания, но и реальные кейсы для работы. Это решает две проблемы: вузы не успевают адаптироваться к изменениям, а бизнесу нужны кадры «здесь и сейчас».
2. Государство как фасилитатор. В России государство не диктует стандарты, а помогает масштабировать успешные практики. Оно поддерживает региональные университеты, инициирует национальные проекты и стимулирует кооперацию. Например, сегодня потребность в ИИ-разработчиках и ML-инженерах оценивается в 199 тысяч человек - и закрыть её без участия бизнеса было бы невозможно.
3. Мотивация через трудоустройство. Одно из ключевых преимуществ корпоративных программ - студенты ещё во время обучения могут рассчитывать на стажировки и работу в компаниях-партнёрах. Это создаёт дополнительный стимул: учащийся видит, что его усилия напрямую связаны с будущей карьерой. При этом компании получают возможность «выращивать» специалистов под свои задачи и отбирать лучших ещё на этапе обучения.

Я отметил, что вузы обычно адаптируются под бурное развитие ИИ медленнее, чем корпоративные организации. Сейчас в стране практикуется микс: с одной стороны, спикеры из крупных организаций преподают в профильных вузах на кафедрах ИИ, а с другой - крупные игроки создают вузы для подготовки профильных специалистов для более прикладных задач. Это позволяет закрывать потребности бизнеса в кадрах быстрее, чем через традиционные академические программы.


Но есть и риски:

- Студенты, которые начинают работать до окончания учёбы, могут не справиться с нагрузкой. Как отметил Евгений Осадчук из «Цифровой экономики», важно выдержать баланс, чтобы не потерять ни практику, ни диплом.
- Корпоративные программы часто нацелены на решение конкретных задач компаний, а не на фундаментальную подготовку. Это может сузить кругозор специалистов, если они не будут дополнительно развиваться за пределами рабочих задач.

Российская модель показывает, как можно совместить академическую базу, гибкость бизнеса и поддержку государства.

#кадры

ген ИИ
2👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
В декабре принято подводить итоги - считать реализованные проекты, подводить итог реализованным целям, считать финансовый результат. А для кого-то результатом является просто факт того, что год завершился и худшего не произошло.

Новый год это всегда время подвести итоги, вспомнить хорошие и плохие события, помечтать о лучшем будущем и даже пообещать себе начать с 1 января жить по-другому.

Надеюсь, для вас этот год был продуктивным и интересным, несмотря на все внешние обстоятельства и тревожные новости.

Мы с нашей командой отслеживаем ключевые технологические новости и тренды, радуемся новым достижениям человечества и красивым реализованным кейсам. Попутно мы пытаемся понять, как будет выглядеть наш мир завтра, какая роль будет у ИИ, а какая останется за человеком. Хочется сказать, что мы разобрались в этом вопросе, но каждый день ставит больше вопросов, чем ответов.

Не знаю, какие у вас планы на 2026, но хочу пожелать одного: чтобы вы не теряли способность критически мыслить и задавать неудобные вопросы. Именно они - двигатель научной мысли и драйвер нашего развития.

С наступающим Новым годом вас. Пусть он будет интересным и ярким на позитивные события.

PS: а наш канал уходит на короткую новогоднюю паузу. Вернёмся после январских праздников — с новыми силами, темами, наблюдениями и новостями

ген ИИ
👍8🔥54🎉1