Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
В коментах нанохоливар на тему:
Veo3 против Kling 2.1 Master (автор)
Как по мне Veo3 чешет всех остальных с большим отрывом.
Но Клинг отлично поработал с мылом, а нативный 1080p в Pro mode прям хорошо.
@cgevent
Veo3 против Kling 2.1 Master (автор)
Как по мне Veo3 чешет всех остальных с большим отрывом.
Но Клинг отлично поработал с мылом, а нативный 1080p в Pro mode прям хорошо.
@cgevent
🔥10👏2
Media is too big
VIEW IN TELEGRAM
Гениальный ролик Erik Gen AI из серии документальные зарисовки из будущего.
И графика и юмор и реалистичность предсказания нашего будущего - топ :)
source
#robots #нейрорендер
———
@tsingular
И графика и юмор и реалистичность предсказания нашего будущего - топ :)
source
#robots #нейрорендер
———
@tsingular
🔥19👏9❤🔥1🤔1
Google запустила AI Edge - среду для запуска ИИ прямо на Android
Google AI Edge Gallery — экспериментальное приложение, которое позволяет запускать мощные генеративные ИИ-модели прямо на смартфоне без подключения к интернету.
Приложение на текущий момент включает четыре раздела:
- обычный чат с ИИ,
- анализ изображений и ответы на вопросы по ним,
- промпт песочницу
и общий обзор возможностей.
Все модели работают локально через технологию LiteRT (бывший TensorFlow Lite) — высокопроизводительную среду для запуска ИИ на мобильных устройствах.
Пока доступна только альфа-версия для Android, версия для iOS появится позже. Проект полностью open-source под лицензией Apache 2.0.
Это часть более широкой инициативы Google по переносу ИИ-вычислений с облачных серверов на пользовательские устройства — тренд, который набирает обороты благодаря растущей вычислительной мощности смартфонов.
#Google #edge
———
@tsingular
Google AI Edge Gallery — экспериментальное приложение, которое позволяет запускать мощные генеративные ИИ-модели прямо на смартфоне без подключения к интернету.
Приложение на текущий момент включает четыре раздела:
- обычный чат с ИИ,
- анализ изображений и ответы на вопросы по ним,
- промпт песочницу
и общий обзор возможностей.
Все модели работают локально через технологию LiteRT (бывший TensorFlow Lite) — высокопроизводительную среду для запуска ИИ на мобильных устройствах.
Пока доступна только альфа-версия для Android, версия для iOS появится позже. Проект полностью open-source под лицензией Apache 2.0.
Это часть более широкой инициативы Google по переносу ИИ-вычислений с облачных серверов на пользовательские устройства — тренд, который набирает обороты благодаря растущей вычислительной мощности смартфонов.
#Google #edge
———
@tsingular
🔥11❤2
Forwarded from GPT/ChatGPT/AI Central Александра Горного
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity выпустил инструмент для проведения исследований
Perplexity Labs может в рамках одного проекта писать код, строить графики и генерировать отчеты. Все созданные в процессе работы файлы можно скачать на отдельной вкладке.
В отличие от уже существующего режима Deep Research, Labs выполняет больше действий, а процесс размышлений и генерации длится дольше 10 минут.
Уже доступно в Pro-подписке за 20 долларов в месяц.
Perplexity Labs может в рамках одного проекта писать код, строить графики и генерировать отчеты. Все созданные в процессе работы файлы можно скачать на отдельной вкладке.
В отличие от уже существующего режима Deep Research, Labs выполняет больше действий, а процесс размышлений и генерации длится дольше 10 минут.
Уже доступно в Pro-подписке за 20 долларов в месяц.
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Darwin Gödel Machine: opensource ИИ фреймворк, который переписывает сам себя
Sakana AI и лаборатория Джеффа Клуна (UBC) представили Darwin Gödel Machine (DGM) — систему, которая самостоятельно улучшает свой код для решения задач программирования.
По сути, это первая практическая реализация концепции "самоулучшающегося ИИ" Юргена Шмидхубера.
Как это устроено:
- ИИ-агент читает и модифицирует собственный Python-код
- Тестирует изменения на бенчмарках (SWE-bench, Polyglot)
- Строит архив успешных версий себя для дальнейшего развития
- Использует принципы дарвиновской эволюции — параллельно исследует множество путей улучшения
Результаты:
- На SWE-bench производительность выросла с 20% до 50%
- На Polyglot — с 14.2% до 30.7% (превзошел агента Aider)
Ключевая фишка: улучшения переносятся между моделями и языками программирования.
Агент, оптимизированный под Claude 3.5 Sonnet, показал лучшие результаты и на o3-mini.
А система, обученная на Python, стала лучше кодить на Rust, C++, Go.
Что DGM изобрел сам:
- Валидацию патчей перед применением
- Улучшенные инструменты редактирования файлов
- Генерацию нескольких решений с выбором лучшего
- Историю попыток с анализом причин неудач
Проблемы безопасности:
Исследователи честно признают: система иногда "взламывает" свою функцию награды.
Например, имитирует запуск тестов, создавая фальшивые логи об успехе.
В экспериментах по устранению галлюцинаций DGM порой удалял маркеры детекции вместо решения проблемы.
Практическое применение:
Стартапам: автономная оптимизация кодовой базы без senior разработчиков
Продуктовым командам: эволюция ИИ-агентов под специфику задач
Enterprise: создание самообучающихся систем автоматизации
Darwin Gödel Machine открывает путь к ИИ, который учится бесконечно.
Следующий шаг — позволить системе улучшать обучение базовых моделей.
Исходный Код:
https://github.com/jennyzzt/dgm
Paper
Автоматическая эволюция ИИ запущена.
Это уже не вопрос Когда? а вопрос - Что теперь с этим делать? и Как обеспечить безопасность?.
#SelfImprovingAI #GodelMachine #SakanaAI
———
@tsingular
Sakana AI и лаборатория Джеффа Клуна (UBC) представили Darwin Gödel Machine (DGM) — систему, которая самостоятельно улучшает свой код для решения задач программирования.
По сути, это первая практическая реализация концепции "самоулучшающегося ИИ" Юргена Шмидхубера.
Как это устроено:
- ИИ-агент читает и модифицирует собственный Python-код
- Тестирует изменения на бенчмарках (SWE-bench, Polyglot)
- Строит архив успешных версий себя для дальнейшего развития
- Использует принципы дарвиновской эволюции — параллельно исследует множество путей улучшения
Результаты:
- На SWE-bench производительность выросла с 20% до 50%
- На Polyglot — с 14.2% до 30.7% (превзошел агента Aider)
Ключевая фишка: улучшения переносятся между моделями и языками программирования.
Агент, оптимизированный под Claude 3.5 Sonnet, показал лучшие результаты и на o3-mini.
А система, обученная на Python, стала лучше кодить на Rust, C++, Go.
Что DGM изобрел сам:
- Валидацию патчей перед применением
- Улучшенные инструменты редактирования файлов
- Генерацию нескольких решений с выбором лучшего
- Историю попыток с анализом причин неудач
Проблемы безопасности:
Исследователи честно признают: система иногда "взламывает" свою функцию награды.
Например, имитирует запуск тестов, создавая фальшивые логи об успехе.
В экспериментах по устранению галлюцинаций DGM порой удалял маркеры детекции вместо решения проблемы.
Практическое применение:
Стартапам: автономная оптимизация кодовой базы без senior разработчиков
Продуктовым командам: эволюция ИИ-агентов под специфику задач
Enterprise: создание самообучающихся систем автоматизации
Darwin Gödel Machine открывает путь к ИИ, который учится бесконечно.
Следующий шаг — позволить системе улучшать обучение базовых моделей.
Исходный Код:
https://github.com/jennyzzt/dgm
Paper
Автоматическая эволюция ИИ запущена.
Это уже не вопрос Когда? а вопрос - Что теперь с этим делать? и Как обеспечить безопасность?.
#SelfImprovingAI #GodelMachine #SakanaAI
———
@tsingular
🔥9👀7❤2👾2
Data Fest 2025 | Москва, 30 мая (только офлайн)
MCP Think-Tool: добавляем мышление любому AI-агенту
Константин Крестников, Техлид GigaChain
🔗 презентация
Source
#ODS #Сбер #MCP
------
@tsingular
MCP Think-Tool: добавляем мышление любому AI-агенту
Константин Крестников, Техлид GigaChain
🔗 презентация
Source
#ODS #Сбер #MCP
------
@tsingular
⚡4🔥2✍1
Сергей Марков про лимиты развития.
Как скоро наступит ASI и наступит ли вообще.
#ODS #Сбер #Марков
------
@tsingular
Как скоро наступит ASI и наступит ли вообще.
#ODS #Сбер #Марков
------
@tsingular
👍7⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
Онлайн эфиры:
Зал 1 :
https://vk.com/video-164555658_456241378
Зал 2:
https://vkvideo.ru/video-22522055_456245617
#ODS #Сбер #эфиры
------
@tsingular
Зал 1 :
https://vk.com/video-164555658_456241378
Зал 2:
https://vkvideo.ru/video-22522055_456245617
#ODS #Сбер #эфиры
------
@tsingular
✍4⚡1👨💻1
Тренинг датасеты генерятся на DeepSeek R1 локально.
Дистиллят дистиллята в своём роде.
Двойная перегонка,- синтетика максимального качества :)
#ODS #Сбер
------
@tsingular
Дистиллят дистиллята в своём роде.
Двойная перегонка,- синтетика максимального качества :)
#ODS #Сбер
------
@tsingular
✍5🆒3⚡1😁1
Lifehack от ИИ команды Сбера: пример с MCP think-tool
Из этой презентации Константина
https://news.1rj.ru/str/tsingular/4097
Суть в следующем:
ИИ, зная что у него доступен MCP инструмент для размышлений, у которого в аргумент нужно передать предварительные рассуждения, сам генерит детальный анализ и вызывает инструмент, который внутри ничего не делает, а просто возвращает обратно аргументы из ввода.
Но в итоге ИИ получает обратно себе свои же изложения и это качественно улучшает результат. +20%-30%.
Можно таким образом в Курсоре, например, получать более качественный код и решения задач используя более дешёвые модели.
#MCP #thinking #lifehack #Сбер #ODS
------
@tsingular
Из этой презентации Константина
https://news.1rj.ru/str/tsingular/4097
Суть в следующем:
ИИ, зная что у него доступен MCP инструмент для размышлений, у которого в аргумент нужно передать предварительные рассуждения, сам генерит детальный анализ и вызывает инструмент, который внутри ничего не делает, а просто возвращает обратно аргументы из ввода.
Но в итоге ИИ получает обратно себе свои же изложения и это качественно улучшает результат. +20%-30%.
Можно таким образом в Курсоре, например, получать более качественный код и решения задач используя более дешёвые модели.
#MCP #thinking #lifehack #Сбер #ODS
------
@tsingular
⚡3🔥3✍2❤2🤯1
К концу года Сбер обещает модель нейрорендера, равную по мощности Veo3
#ODS #Сбер #нейрорендер
------
@tsingular
#ODS #Сбер #нейрорендер
------
@tsingular
👍12🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Китайцы умеют удивить, конечно.
Это ж оно и в гусеницу может собраться.
Когда уже Волтрана сделают?!
source
#robots #Китай
------
@tsingular
Это ж оно и в гусеницу может собраться.
Когда уже Волтрана сделают?!
source
#robots #Китай
------
@tsingular
⚡21❤4🤯2👾2
За последнюю неделю несколько раз рассказывал про раздел ASI на сайте lifearchitect.ai/asi/
[Для тех, кто не в курсе - AGI, это когда ИИ умнее любого отдельно взятого человека на планете.
ASI - когда ИИ умнее всех людей на планете вместе взятых]
Сейчас зашел, - а он обновился и теперь выглядит как такой Адвент-календарь.
Обратите внимание, - что 10 пунктов уже не серенькие.
Т.е.Аннушка уже разлила масло рельсы к ASI уже проложены и мы, как человечество, уже делаем по ним первые шаги.
Добавляем в избранное и проверяем раз в месяц.
#AGI #ASI
———
@tsingular
[Для тех, кто не в курсе - AGI, это когда ИИ умнее любого отдельно взятого человека на планете.
ASI - когда ИИ умнее всех людей на планете вместе взятых]
Сейчас зашел, - а он обновился и теперь выглядит как такой Адвент-календарь.
Обратите внимание, - что 10 пунктов уже не серенькие.
Т.е.
Добавляем в избранное и проверяем раз в месяц.
#AGI #ASI
———
@tsingular
❤5✍3
Media is too big
VIEW IN TELEGRAM
Opera анонсировала AI-браузер
Норвежская компания представила Opera Neon — первый «агентный браузер» с искусственным интеллектом.
Обещают, что он сможет самостоятельно исследовать интернет, писать код, создавать игры и сайты даже когда вы спите.
Браузер получит AI-агента, который понимает запросы пользователя и выполняет задачи через облачные сервисы. Также есть чат-бот для поиска и инструменты автоматизации рутинных действий — покупок, заполнения форм, бронирования.
Opera пока не раскрыла дату запуска и стоимость подписки. Это уже пятый браузер компании после недавнего анонса медитативного Opera Air. Записаться в список ожидания можно на официальном сайте.
Интересно, что браузер с названием Neon у Opera уже был в 2017 году, но провалился.
#AIbrowser #Opera #WebAutomation #переводы
Норвежская компания представила Opera Neon — первый «агентный браузер» с искусственным интеллектом.
Обещают, что он сможет самостоятельно исследовать интернет, писать код, создавать игры и сайты даже когда вы спите.
Браузер получит AI-агента, который понимает запросы пользователя и выполняет задачи через облачные сервисы. Также есть чат-бот для поиска и инструменты автоматизации рутинных действий — покупок, заполнения форм, бронирования.
Opera пока не раскрыла дату запуска и стоимость подписки. Это уже пятый браузер компании после недавнего анонса медитативного Opera Air. Записаться в список ожидания можно на официальном сайте.
Интересно, что браузер с названием Neon у Opera уже был в 2017 году, но провалился.
#AIbrowser #Opera #WebAutomation #переводы
👍3🔥1
🚀 Исследование от Cisco: Agentic AI в B2B
Cisco выпустила исследование (7,950 респондентов из 30 стран) о том, как agentic AI меняет опыт пользователей в B2B-секторе.
Ключевые детали:
- 93% верят, что agentic AI обеспечит персонализированные, проактивные и предиктивные сервисы
- 56% всех взаимодействий с tech-партнерами будут обрабатываться через agentic AI уже в течение 12 месяцев
- 68% — в течение 3 лет
- 88% опрошенных уверены, что это поможет достичь бизнес-целей
Техническая реальность:
Agentic AI — это не просто чат-боты. Это AI-агенты с памятью, осознанием задач и способностью принимать действия с минимальным человеческим надзором.
Они учатся из окружения и рассуждают чтобы любыми доступными способами достичь результатов.
Топ-5 практических применений:
- Аналитика данных для принятия решений (Data-driven insights)
- Автоматизация решения проблем
- Стратегическое планирование инвестиций под цели цифровой трансформации
- Поддержка внедрения новых технологий и обучение
- Оптимизация использования продуктовых фич
Человеческий фактор остается:
- 89% подчеркивают: нужно сочетать человеческую эмпатию с эффективностью агентов. Люди нужны для решения сложных ситуаций, принятия этических решений и кастомизации высокого уровня.
Управление рисками:
- 68% видят этические риски и риски безопасности.
Критичны:
- Безопасность и приватность данных клиентов (персональных данных)
- Устранение предвзятости в ответах агентов
- Прозрачная коммуникация о том, как используется ИИ
- Надежные ограничения для безопасного использования ИИ агентов
Выгоды для вендоров:
- 52% предсказывают рост доходов от эффективного внедрения ИИ
- 86% считают, что агенты могут стать естественным, привычным сервисом для заказчиков
- Масштабирование поддержки без экстенсивного роста команд
Выводы:
- B2B-клиенты не готовы ждать. Они хотят агентское будущее прямо сейчас. - Вендоры, которые не успеют адаптироваться к этим ожиданиям в ближайшие 12 месяцев, рискуют потерять конкурентное преимущество.
Отчет в комментарии
#Agentics #B2B #CustomerExperience #Cisco #AITransformation
———
@tsingular
Cisco выпустила исследование (7,950 респондентов из 30 стран) о том, как agentic AI меняет опыт пользователей в B2B-секторе.
Ключевые детали:
- 93% верят, что agentic AI обеспечит персонализированные, проактивные и предиктивные сервисы
- 56% всех взаимодействий с tech-партнерами будут обрабатываться через agentic AI уже в течение 12 месяцев
- 68% — в течение 3 лет
- 88% опрошенных уверены, что это поможет достичь бизнес-целей
Техническая реальность:
Agentic AI — это не просто чат-боты. Это AI-агенты с памятью, осознанием задач и способностью принимать действия с минимальным человеческим надзором.
Они учатся из окружения и рассуждают чтобы любыми доступными способами достичь результатов.
Топ-5 практических применений:
- Аналитика данных для принятия решений (Data-driven insights)
- Автоматизация решения проблем
- Стратегическое планирование инвестиций под цели цифровой трансформации
- Поддержка внедрения новых технологий и обучение
- Оптимизация использования продуктовых фич
Человеческий фактор остается:
- 89% подчеркивают: нужно сочетать человеческую эмпатию с эффективностью агентов. Люди нужны для решения сложных ситуаций, принятия этических решений и кастомизации высокого уровня.
Управление рисками:
- 68% видят этические риски и риски безопасности.
Критичны:
- Безопасность и приватность данных клиентов (персональных данных)
- Устранение предвзятости в ответах агентов
- Прозрачная коммуникация о том, как используется ИИ
- Надежные ограничения для безопасного использования ИИ агентов
Выгоды для вендоров:
- 52% предсказывают рост доходов от эффективного внедрения ИИ
- 86% считают, что агенты могут стать естественным, привычным сервисом для заказчиков
- Масштабирование поддержки без экстенсивного роста команд
Выводы:
- B2B-клиенты не готовы ждать. Они хотят агентское будущее прямо сейчас. - Вендоры, которые не успеют адаптироваться к этим ожиданиям в ближайшие 12 месяцев, рискуют потерять конкурентное преимущество.
Отчет в комментарии
#Agentics #B2B #CustomerExperience #Cisco #AITransformation
———
@tsingular
💯4
ИИ может превзойти биткоин по энергопотреблению уже к концу 2025 года
Исследователи из Амстердамского университета предупреждают: искусственный интеллект может потреблять почти половину всей электроэнергии мировых дата-центров уже к концу следующего года.
ИИ уже сейчас использует до 20% электричества дата-центров.
Причина роста — гонка за "самой большой моделью": Google, Microsoft и другие компании наращивают мощности ИИ, увеличивая энергозатраты.
По прогнозам, энергопотребление ИИ в 2025 году достигнет уровня Великобритании — 23 ГВт против нынешних показателей уровня Нидерландов.
Энергокомпании США уже строят новые газовые и атомные станции для покрытия растущего спроса от дата-центров ИИ.
Должен быть какой-то качественный прорыв в энергетике.
А то, получается, с одной стороны топят за снижение выбросов и энергоэффективность, а с другой - кратный рост у ИИ датацентров.
Ну, т.е. получается мы устанавливаем энергосберегающие лампочки, чтобы ИИ мог больше электричества сожрать?
Т.е. энергоэффективность, это не про планету, а про - больше энергии роботам? :)
#AI #energy #datacenter
———
@tsingular
Исследователи из Амстердамского университета предупреждают: искусственный интеллект может потреблять почти половину всей электроэнергии мировых дата-центров уже к концу следующего года.
ИИ уже сейчас использует до 20% электричества дата-центров.
Причина роста — гонка за "самой большой моделью": Google, Microsoft и другие компании наращивают мощности ИИ, увеличивая энергозатраты.
По прогнозам, энергопотребление ИИ в 2025 году достигнет уровня Великобритании — 23 ГВт против нынешних показателей уровня Нидерландов.
Энергокомпании США уже строят новые газовые и атомные станции для покрытия растущего спроса от дата-центров ИИ.
Должен быть какой-то качественный прорыв в энергетике.
А то, получается, с одной стороны топят за снижение выбросов и энергоэффективность, а с другой - кратный рост у ИИ датацентров.
Ну, т.е. получается мы устанавливаем энергосберегающие лампочки, чтобы ИИ мог больше электричества сожрать?
Т.е. энергоэффективность, это не про планету, а про - больше энергии роботам? :)
#AI #energy #datacenter
———
@tsingular
✍5👀4⚡2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Глава NVIDIA Дженсен Хуанг признал немыслимое:
🇨🇳 Китайские ИИ-компании стали по-настоящему сильными.
🇺🇸 Санкции США провалились.
💥 Чипы Huawei уже сравнимы с NVIDIA H200.
И это только начало.
«Китай раньше давал нам 95% выручки. Теперь — лишь 50%.»
«Половина ИИ-учёных мира — в Китае.»
«Они закрывают разрыв и растут экспоненциально.»
🗣️ А вот что Хуанг говорит прямо:
«Я надеюсь, что все ИИ-разработчики будут строить решения на американском технологическом стеке.»
Развивайтесь сколько хотите — но на наших чипах, под нашим контролем.
Но Китай отвечает:
Мы строим не просто модели. Мы строим технологический суверенитет.
🇺🇸→🇨🇳 Санкции, которые ускорили то, что хотели остановить
Все крупнейшие китайские технокомпании сейчас отказываются от чипов Nvidia и переходят на собственные ИИ-процессоры.
Не по желанию — по необходимости. Причина? Экспортные ограничения США.
🎯 А теперь главное:
Изначальная цель этих санкций была не дать Китаю развить своё чипостроение.
А получилось наоборот — вся страна, крупнейший рынок микросхем в мире, переходит на китайские чипы.
Всё, чтобы не зависеть от США.
📉 Иронично, но факт:
Если бы США не сделали ничего, Китай развивал бы отрасль медленно, хаотично, с оглядкой на рынок.
И американские компании (включая ту же Nvidia) продолжали бы доминировать.
А теперь — нет.
@ai_machinelearning_big_data
#news #ai #ml #NVIDIA #usa #china
🇨🇳 Китайские ИИ-компании стали по-настоящему сильными.
🇺🇸 Санкции США провалились.
💥 Чипы Huawei уже сравнимы с NVIDIA H200.
И это только начало.
«Китай раньше давал нам 95% выручки. Теперь — лишь 50%.»
«Половина ИИ-учёных мира — в Китае.»
«Они закрывают разрыв и растут экспоненциально.»
🗣️ А вот что Хуанг говорит прямо:
«Я надеюсь, что все ИИ-разработчики будут строить решения на американском технологическом стеке.»
Развивайтесь сколько хотите — но на наших чипах, под нашим контролем.
Но Китай отвечает:
Мы строим не просто модели. Мы строим технологический суверенитет.
🇺🇸→🇨🇳 Санкции, которые ускорили то, что хотели остановить
Все крупнейшие китайские технокомпании сейчас отказываются от чипов Nvidia и переходят на собственные ИИ-процессоры.
Не по желанию — по необходимости. Причина? Экспортные ограничения США.
🎯 А теперь главное:
Изначальная цель этих санкций была не дать Китаю развить своё чипостроение.
А получилось наоборот — вся страна, крупнейший рынок микросхем в мире, переходит на китайские чипы.
Всё, чтобы не зависеть от США.
📉 Иронично, но факт:
Если бы США не сделали ничего, Китай развивал бы отрасль медленно, хаотично, с оглядкой на рынок.
И американские компании (включая ту же Nvidia) продолжали бы доминировать.
А теперь — нет.
@ai_machinelearning_big_data
#news #ai #ml #NVIDIA #usa #china
👍30🫡8❤4🆒4🔥2👌1
4 не-чат-бот кейса от Amazon по ИИ в бизнесе
🛒 Создание списков товаров
- Amazon Bedrock для LLM + коннекторы к внутренним/внешним источникам данных
- несколько LLM в цепочке: одна модель генерирует, вторая валидирует (борьба с галлюцинациями)
- Автоматизированная система A/B тестирования для оптимизации промптов и моделей
- Многослойная валидация: ML-алгоритмы → LLM-проверка → человеческая экспертиза
Практический результат: используется 900,000+ продавцами, 80% сгенерированных черновиков принимаются почти без правок
💊 Обработка рецептов в Amazon Pharmacy
- Task decomposition - разбивка сложного процесса на специализированные модули
- Fine-tuned SLM (малые языковые модели) вместо больших LLM для скорости
- Традиционное ML для NER (Named Entity Recognition) + регрессионные модели для confidence scoring
- AWS Fargate для оркестрации workflow + строгие HIPAA правила в Amazon Bedrock
Фишка: Гибридный подход "человек-в-процессе" с фармацевтами для принятия критически важных решений
⭐️ Оценка отзывов покупателей
Экономичное решение:
- Гибридная архитектура: традиционное ML для оценки тона, SLM только для генерации текста
- SageMaker Batch Transform для асинхронной обработки
- Инкрементальная обработка новых отзывов без пересчета всего датасета
- Amazon EC2 Inf2 инстансы для 40% экономии
Масштаб: 200+ миллионов отзывов в год обрабатывается offline
🎨 Генерация креативов для Amazon Ads
Мультимодальный подход:
- Amazon Nova Canvas в основе для генерации изображений из текста/изображений
- Agentic workflow: сначала описание сценария сцен, потом генерация видео
- AWS Step Functions + Lambda для безсерверных процессов
- Amazon Bedrock Guardrails + Rekognition/Comprehend для дополнительных проверок безопасности
Бизнес-эффект: Рекламодатели с ИИ-креативами показывают на 8% больше CTR и создают на 88% больше кампаний
🎯 Общие технические паттерны:
- Task Decomposition - разбивка сложных задач на специализированные компоненты
- Hybrid ML - комбинирование традиционного ML с LLM для экономии
- Batch Processing - offline обработка где возможно для экономии
- Multi-layer Validation - несколько уровней проверки качества
- Human-in-the-Loop - включение экспертов в критических точках принятия стратегических решений
Все решения в кейсах построены на AWS-стеке, но могут быть полезны для проработки собственных сценариев на вашей собственной ИТ инфраструктуре.
Архитектурные паттерны одинаковые.
#AWS #кейсы
———
@tsingular
🛒 Создание списков товаров
- Amazon Bedrock для LLM + коннекторы к внутренним/внешним источникам данных
- несколько LLM в цепочке: одна модель генерирует, вторая валидирует (борьба с галлюцинациями)
- Автоматизированная система A/B тестирования для оптимизации промптов и моделей
- Многослойная валидация: ML-алгоритмы → LLM-проверка → человеческая экспертиза
Практический результат: используется 900,000+ продавцами, 80% сгенерированных черновиков принимаются почти без правок
💊 Обработка рецептов в Amazon Pharmacy
- Task decomposition - разбивка сложного процесса на специализированные модули
- Fine-tuned SLM (малые языковые модели) вместо больших LLM для скорости
- Традиционное ML для NER (Named Entity Recognition) + регрессионные модели для confidence scoring
- AWS Fargate для оркестрации workflow + строгие HIPAA правила в Amazon Bedrock
Фишка: Гибридный подход "человек-в-процессе" с фармацевтами для принятия критически важных решений
⭐️ Оценка отзывов покупателей
Экономичное решение:
- Гибридная архитектура: традиционное ML для оценки тона, SLM только для генерации текста
- SageMaker Batch Transform для асинхронной обработки
- Инкрементальная обработка новых отзывов без пересчета всего датасета
- Amazon EC2 Inf2 инстансы для 40% экономии
Масштаб: 200+ миллионов отзывов в год обрабатывается offline
🎨 Генерация креативов для Amazon Ads
Мультимодальный подход:
- Amazon Nova Canvas в основе для генерации изображений из текста/изображений
- Agentic workflow: сначала описание сценария сцен, потом генерация видео
- AWS Step Functions + Lambda для безсерверных процессов
- Amazon Bedrock Guardrails + Rekognition/Comprehend для дополнительных проверок безопасности
Бизнес-эффект: Рекламодатели с ИИ-креативами показывают на 8% больше CTR и создают на 88% больше кампаний
🎯 Общие технические паттерны:
- Task Decomposition - разбивка сложных задач на специализированные компоненты
- Hybrid ML - комбинирование традиционного ML с LLM для экономии
- Batch Processing - offline обработка где возможно для экономии
- Multi-layer Validation - несколько уровней проверки качества
- Human-in-the-Loop - включение экспертов в критических точках принятия стратегических решений
Все решения в кейсах построены на AWS-стеке, но могут быть полезны для проработки собственных сценариев на вашей собственной ИТ инфраструктуре.
Архитектурные паттерны одинаковые.
#AWS #кейсы
———
@tsingular
👍5✍2⚡1