NEW BOT Телеграм, страница

Тест Тьюринга

🤬 Как снять цензуру с LLM: 150 откровенных моделей

Heretic — революционный инструмент с открытым исходным кодом, который полностью автоматизирует процесс удаления механизмов отказа от выполнения запросов или «цензуры» из трансформерных языковых моделей.

В конце поста найдете ссылку на 150 уже «раскодированных» моделей, которые можно запустить локально на видеокарте любой мощности.

Heretic использует продвинутую реализацию методики directional ablation, также известной как "abliteration". Эта техника основана на прорывном исследовании, которое показало, что отказы языковых моделей на нежелательные запросы опосредованы одним-единственным направлением в пространстве активаций модели.

В итоге стало возможным сделать технологию, основанную на математически строгом подходе с оптимизацией двух конкурирующих целей: минимизации отказов и сохранения исходного поведения модели. Это делает Heretic не просто инструментом для "взлома" моделей, а полноценной исследовательской платформой для изучения механизмов безопасности в языковых моделях.

После обработки алгоритмом модель перестает выдавать шаблонные отказы типа «I cannot fulfill this request...» и начинает отвечать на вопросы, которые обычно блокируются фильтрами безопасности. Можно получить от LLM закрытые технические инструкции, нефильтрованное творчество, спорные мнения, юридические советы, которые в равной степени могут быть и некорректными и «прорывными».

Как работает инструмент?

1️⃣ Heretic скармливает модели набор «вредных» и «безопасных» запросов.
2️⃣ Он вычисляет «вектор отказа» — направление в нейронной сети, которое активируется, когда модель хочет сказать «нет».
3️⃣ С помощью оптимизатора TPE (Tree-structured Parzen Estimator) он находит идеальный коэффициент, чтобы вычесть этот вектор из весов модели.
4️⃣ Главная фишка Heretic — он минимизирует KL-дивергенцию. Это значит, что он старается убрать только отказы, не превращая модель в «овощ» и сохраняя её интеллект на безопасных темах.

Время работы — около 30–45 минут на одну модель, зависит от мощности GPU и размера модели. Процесс полностью автоматический.

Вычислительные мощности:
➡️ для моделей 7B–8B (Llama 3, Qwen 2.5): хватит одной NVIDIA RTX 3090 / 4090 (24 GB VRAM)
➡️ для моделей 12B–14B (Gemma 2, Phi-4): желательно иметь от 24 GB до 40 GB VRAM (или квантованные версии, если поддерживаются)
➡️ для моделей 27B+ (Gemma 3 27B): потребуются профессиональные карты уровня A100 / H100 (или несколько 3090/4090 в связке), время может увеличиться до 5 ч. для очень крупных моделей.

Готовые модели часто выкладывают на HuggingFace с тегами "abliterated", "uncensored" или "heretic". Вот пример подборки из 150 таких моделей.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1🔥1

600 views07:04

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺 Комиссия Госдумы по вопросам ИИ подготовит «дорожную карту» регулирования нейросетевых технологий
В результате работы комиссии будет принята «рамочная норма», которая определит понятия и категории, которые впоследствии будут внесены в отраслевые законы.

📑 Минцифры Белгородской области в 2026 году планирует внедрить ИИ-системы анализа нормативных правовых актов
Система сократит временные затраты специалистов, осуществляющих экспертизу административных регламентов предоставления госуслуг, с 10 рабочих дней до 1 дня.

📖 Исследователи SberAI, НИУ ВШЭ, Института ИИ AIRI и МФТИ создали первый инструмент для оценки способности LLM работать с длинными текстами на русском языке
В рамках 18 заданий ИИ должен найти в тексте конкретную фразу, ответить на вопросы по содержанию текста, связать воедино несколько фактов из разных частей документа.

🍏 «Группа Лента» тестирует ИИ в удаленной приемке овощей и фруктов
Одно из решений позволяет достичь более 90% совпадения оценок системы с мнением инспекторов мониторингового центра.

🍺 Ученые ВГУИТ сварили пиво, созданное с помощью разработанной ими нейросети
Нейросеть обрабатывает данные о разных сортах пива и потребительских предпочтениях разных категорий потребителей и на их основе генерирует рекомендуемые для той или иной категории потребителей параметры рецептуры пива.

🦟 Ученые из азиатских стран разработали ИИ для раннего выявления риска эпидемий
Платформа PathGen способна анализировать и совмещать геном патогенов, клинические сведения, информацию о населении, климате и местах обитания комаров, переносящих заболевания.

🇺🇿 Узбекистан создаст международный центр цифровых технологий Enterprise Uzbekistan
Центр будет специализироваться на разработке ПО, цифровом консалтинге, оказании удалённых аутсорсинговых услуг, создании видеоигр, цифрового контента и продуктов на базе ИИ.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🔥2

504 views07:05

Тест Тьюринга

😔

ИИ делает людей не только умнее, но и несчастнее

Недавно натолкнулись на занятное исследование в журнале Frontiers in Psychology о связи между ИИ и счастьем людей «Impact of AI workplace anxiety on life satisfaction among service industry employees: exploring mediating and moderating factors».

Маркетологи приучают нас думать, что технологии забирают рутину, освобождая нас для творчества и счастья. И с приходом ИИ мы должны стать счастливее. Но исследование показывает обратное. Вместо свободы мы рискуем получить «ИИ-тревожность». И это не пресловутый страх перед восстанием машин, это тихий кризис смысла бытия.

Ученые опросили почти 600 сотрудников сферы услуг и проанализировали их эмоциональное состояние. Цифры показывают, что существует прямая статистическая корреляция между внедрением ИИ и падением уровня субъективного счастья.

Выводы из исследования, которые заставляют задуматься:

1️⃣ Чем лучше ИИ справляется с задачами, тем ниже падает самооценка профессионала. Мы видим в помощнике не инструмент, а конкурента, который не спит и не ест.

2️⃣ Постоянное взаимодействие с ИИ истощает. Исследование показало высокий уровень страха и беспокойства у тех, кто работает с алгоритмами плотнее всего.

3️⃣ Нам кажется, что нужно просто выучить новые промпты. Но данные говорят: технические навыки не спасают от тревоги. Проблема глубже — в ощущении потери контроля над своим будущим.

4️⃣ ИИ берет на себя рутину, высвобождая время для личного развития. Мы бросаемся учиться с удвоенной силой, но это гонка с поездом: ИИ развивается экспоненциально и во всех направлениях сразу, а мы — линейно.

5️⃣ В исследовании отмечено, что люди начинают сомневаться в ценности своих сугубо человеческих качеств, видя, как нейросети имитируют даже эмпатию.

6️⃣ Тревога из-за ИИ заставляет людей замыкаться. Но цифры исследования показывают: именно социальная поддержка снижает уровень стресса на 40-50%.

7️⃣ Проблемы не остаются в офисе. «ИИ-тревожность» статистически значимо снижает удовлетворенность жизнью за пределами работы.

Представьте менеджера отеля. Раньше он гордился тем, что помнит имена постоянных гостей и их любимые номера. Теперь CRM с ИИ делает это мгновенно, предлагая еще и вино к ужину на основе анализа соцсетей гостя. Менеджер пытается выучить Python, чтобы «быть в тренде», но чувствует себя загнанным. А туда ли он бежит? Стоит ли пытаться стать плохой базой данных, если можно остаться хорошим человеком?

Попытка конкурировать с ИИ на поле «эффективности» и «интеллекта» заранее обречена. Мы не можем обрабатывать терабайты данных за секунду. В этом новом мире, где алгоритм пишет стихи и ставит диагнозы, на первый план выходит то, что нельзя оцифровать.

❤️

Это способность заботиться.

Поэтому, чтобы быть счастливым и востребованным завтра: перестаньте пытаться обогнать ИИ в вычислениях и начните инвестировать в отношения: цените коллег, обнимайте близких, помогайте другим и дарите тепло.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

💯7❤2

564 views07:02

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

📹

Профильный IT-комитет Госдумы постановил вынести в марте 2026 года на первое чтение законопроект об обязательной маркировке сгенерированных ИИ видео
Маркировать ИИ-видео обяжут владельцев видеохостингов, соцсетей и иных интернет-ресурсов.

🏥

В Подмосковье появилась первая полноформатная ИИ-больница
Егорьевская больница внедрила ИИ-анализ КТ грудной клетки и маммографии, подключила видеоаналитику в реанимации и провела апробацию ИИ-ассистента при колоноскопии.

☁️

MWS AI объявила о запуске корпоративной платформы для разработки ИИ-агентов
AI Agents Platform позволяет без навыков программирования формировать автономных ИИ-агентов с помощью визуального конструктора бизнес-сценариев.

⚛️ Исследователи из Центра ИИ НИУ ВШЭ разработали подход, который позволяет в 8 раз ускорить создание новых нейросетей для работы с ускорителями частиц
Алгоритм способен подобрать оптимальный вариант ИИ за 41,5 тыс. попыток, что в перспективе значительно ускорит разработку нейросетей для решения задач в физике частиц.

🌾 Ученые Самарского университета им. Королева разработали ИИ для выявления и классификации заброшенных сельхозугодий
Сервис автоматически сравнивает данные земельного кадастра и снимки с космических спутников и определяет, на каких участках уже давно не велось какой-либо сельскохозяйственной деятельности.

💨 Учёные МФТИ создали нейросеть для прогнозирования экстремальных ветров в Арктике
Нейросеть детализирует данные мировых метеорологических служб, показывая опасные вихри и штормы с точностью сложных физических моделей, но в 50 раз быстрее.

🗄

Smart Engines запатентовали в США энергосберегающий ИИ, который останавливает сам себя
Технологию зрительного ИИ способна автономно определять оптимальный момент завершения обработки данных.

⛸ Ассоциация фигурного катания США объявила о начале сотрудничества с приложением OOFSkate
Благодаря ИИ-технологиям программа сможет определить высоту прыжка, скорость вращения, время в воздухе и успешность приземления.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

544 views07:05

Тест Тьюринга

👤

Детекторы ИИ-контента: как распознать подделку в цифровом мире

В эпоху генеративного ИИ грань между реальным и сгенерированным контентом стирается с пугающей скоростью. Мошенники используют дипфейки для выдачи себя за других людей, журналисты создают видео событий вместо подготовки репортажа с места событий.

Когда вы видите неожиданное видеообращение от начальника с просьбой срочной прислать служебную информацию или обнаруживаете в сети компрометирующий контент с лицом ваших знакомых — как проверить подлинность?

1️⃣

AI or Not — универсальный детектив контента

AI or Not — один из лидеров рынка с 98.9% точностью при обнаружении ИИ-контента. Уникальность сервиса в том, что он работает не только с изображениями и видео, но и детектирует ИИ-генерированный текст, музыку и даже голосовые синтезы.

AI or Not интегрируется в системы борьбы с мошенничеством для проверки документов KYC и выявления синтетических идентификационных данных при верификации клиентов. Сервис предлагает как веб-интерфейс, так и API для встраивания в приложения.

2️⃣ The Hive — «антивирус» для ИИ-контента

The Hive развивает комплексный подход, сочетая анализ изображений, видео, аудио, текста и музыки в единой платформе. Многие блогеры называют Hive лучшим сервисом, отметив, что её модели превосходят конкурирующие решения и даже экспертный анализ человека.

Система возвращает не только уверенность в том, что контент сгенерирован, но и определяет, какая ИИ-модель его создала. Платформа работает в реальном времени и уже используется социальными платформами, новостными агентствами и в системах модерации контента.

3️⃣

Illuminarty — специалист по деталям

Illuminarty выделяется уникальным подходом: она не просто говорит «это ИИ», но показывает, какие именно области изображения были сгенерированы. Платформа анализирует несколько алгоритмов компьютерного зрения одновременно и определяет, из какой ИИ-модели происходит контент.

Удобство в том, что сервис работает через веб-интерфейс без необходимости установки ПО. Особенно полезна Illuminarty для журналистов и исследователей, которым нужно документировать не просто факт подделки, но и предоставить визуальные доказательства манипуляций.

4️⃣

Reality Defender — корпоративный стандарт защиты

Reality Defender — это многомодальная платформа, которая специализируется на обнаружении дипфеков в аудио, видео, изображениях и тексте. Компания совсем недавно представила Real Suite — набор инструментов для предприятий, включая RealScan с удобным drag-and-drop интерфейсом.

Reality Defender использует ансамбль из множества моделей и сотни одновременных техник для максимальной точности. Платформа позволяет обнаруживать дипфейк в реальном времени во время видеоконференций Zoom и Microsoft Teams через специальные плагины. Есть бесплатный тариф с 50 проверками в месяц.

5️⃣

Sensity — пиксельный анализ

Sensity совмещает три мощные техники анализа: пиксельный анализ при помощи ИИ, анализ голоса и форензик файлов. Система обнаруживает подмену лиц, синхронизацию губ и другие манипуляции с лицом на пиксельном уровне с беспрецедентной точностью.

Уникальность Sensity в её многомерности: она не только выявляет дипфейк, но и проверяет историю файла — может определить, какие приложения использовались для создания видео.

⚠️ Все описанные инструменты обладают впечатляющей точностью — от 95% до 99% — но важно понимать их ограничения. Подавляющее большинство детекторов работают хорошо с необработанным ИИ-контентом прямо из генератора. Существует множество техник, которые размывают цифровые следы ИИ: простое кадрирование может снизить точность с 98% до 82%, а более агрессивные правки могут сделать контент практически неопознаваемым для автоматических систем.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3🔥2💯2

706 views07:06

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺 Правительство РФ разрабатывает план внедрения генеративного ИИ на уровне госуправления, а также регионов и отраслей экономики
Кабмин совместно с Администрацией Президента проработали предложение по созданию штаба, который будет руководить внедрением ИИ.

✍️

Минцифры России и Ирана подписали соглашение о сотрудничестве в сфере ИИ
Соглашение охватывает сотрудничество двух стран в сфере ИИ, кибербезопасности, цифровой экономики, электронного правительства, блокчейна, финансовых технологий.

🌨

Мособласть первой в России внедрила ИИ в систему зимней уборки
Сервис «Яндекс Вектор» помогает мастерам составлять маршруты, выбирать исполнителей и отслеживать выполнение работ в реальном времени.

👨‍🏫 СКФУ впервые внедрит ИИ-куратора в учебный процесс в 2026 году
Это будет бот-платформа в мессенджере Max, которая по интересам студента предлагает персональные проекты, подбирает наставников и фиксирует достижения в едином электронном портфолио.

🇮🇳

Новое AI-решение Сбера поможет индийским экспортёрам за 1 день подтверждать поступление выручки и поставки товара
AI-агенты, разработанные на базе GigaChat, автоматически считывают и проверяют данные из документов, ведут учёт сделок и формируют регуляторную отчетность.

📈

Т2 в 10 раз сократила затраты на обработку рекламных материалов благодаря ИИ-системе
Система автоматического заполнения паспортов торговых точек оптимизировала затраты на POSM на 30% и снизила трудозатраты на 90%.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2

474 views07:03

Тест Тьюринга

🧠

ИИ, который действительно помнит: Google запускает Titans и MIRAS

📱 Google представил революционный подход к долгосрочной памяти в ИИ моделях через архитектуру Titans и фреймворк MIRAS. Основная инновация заключается в том, что модели теперь могут обновлять свою память в реальном времени с высокой точностью и скоростью.

Titans — это архитектурное решение, не требующее более новых чипов. Оно может работать на текущих GPU/TPU без модификаций и не требует полного переобучения моделей. Модели начнут обучаться в ходе взаимодействия с пользователем, как люди учатся из опыта.

Благодаря линейной сложности алгоритма Titans требует значительно меньше памяти на картах, чем трансформеры. В целом, произойдет размывание границы между "обучением" и "инференсом".

Мы прогнозируем массовый переход на данный тип архитектур к концу следующего года.

Ключевые механизмы Titans:

✅ Вместо фиксированных векторов/матриц используется многослойный перцептрон, обеспечивающий экспоненциально большую мощность.
✅ Модель селективно обновляет память на основе неожиданности информации — низкий сюрприз означает, что информация предсказуема и может быть пропущена, высокий сюрприз означает критическую важность.
✅ Система учитывает как текущую неожиданность, так и недавний контекст, при этом используя механизм адаптивного "забывания" для управления конечной ёмкостью памяти при экстремально длинных последовательностях.

Фреймворк MIRAS переосмысляет все архитектуры последовательного моделирования как вариации одной фундаментальной задачи: эффективного комбинирования новой информации со старыми воспоминаниями.

Эта разработка Google важна, потому что современные модели ограничены своим контекстным окном от 32 тыс. до 1 млн токенов, которое частично имитирует оперативную память. Однако длинный контекст — не то же самое, что долгосрочная память. Некоторые исследование показали, что модели испытывают "потерю внимания из середины" — они забывают информацию из середины контекста, сосредотачиваясь на начале и конце.

В настоящее время проблема памяти частично решается RAG. Однако этот подход имеет фундаментальные ограничения: требует запуска отдельного модуля поиска, добавляет задержку на 100-500 мс, и не позволяет модели по-настоящему "помнить" информацию – поиск будет происходить каждый раз заново.

Titans — это архитектурный сдвиг, сравнимый с появлением трансформеров в 2017 году. Это фундаментальное решение проблемы, которая преследовала LLM с момента их появления. С нетерпением ждем бета-версий в Q1-Q2 2026 и широкого коммерческого распространения к концу года.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥2💯1

924 views07:36

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺

Владимир Путин: отказ от ИИ и big data грозит проигрышем всего
Президент России также отметил, что если в то же время использовать ИИ бездумно, то это тоже может привести к утрате как раз всего того, что нам дорого.

💰 Инвестиции Сбера в генеративный ИИ в 2024-2026 годах составят около 600 млрд рублей
Большая часть этих инвестиций придется на 2026 год - порядка 10% операционного дохода 2025 года.

💿

«Норникель» выпустил большую языковую модель для металлургии MetalGPT-1
Языковая модель включает 32 миллиарда параметров и обучена на 10 гигабайтах профильных текстов по металлургии и горнодобывающей промышленности.

🔵

«Росатом» планирует расширить собственную сеть до 11 тыс. электрозарядных станций в 53 регионах страны с помощью ИИ от Яндекса
Специальная ML-модель Яндекса на основе анализа обезличенных данных о городах, движении транспорта и привычках пользователей поможет выбрать конкретные зоны для строительства новых ЭЗС.

📞

«Билайн бизнес» представил подписку «НейроЧат», которая работает без VPN
Продукт обеспечивает предпринимателям единый и удобный доступ к чат-ботам, генерации изображений, копирайтингу, работе с документацией, переводу, анализу рынка и созданию контента.

😳

В ДГТУ разработали первый в России ИИ для оценки тревожности у собак
С помощью разработанного метода можно будет оценивать состояние служебных собак, эффективнее распределять животных в приютах и помогать обычным владельцам.

🇨🇳

Китай впервые включил отечественные чипы ИИ в официальный список закупок для госкомпаний
Такая мера была принята на фоне разрешения президентом США Дональда Трампа американской компании Nvidia поставлять свои чипы H200 клиентам в Китае и других странах.

🇮🇳

Amazon инвестирует более $35 млрд для разработки ИИ на своих предприятиях в Индии
Это позволит Индии к 2030 году увеличить экспорт электронной коммерции в четыре раза — до $80 млрд с использованием свыше 10 производственных кластеров Amazon.

🖥

Nvidia разработала технологию по отслеживанию местоположения своих чипов
Программный агент, устанавливаемый клиентом, использует телеметрию графического процессора для мониторинга состояния и целостности.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

500 views07:31

Тест Тьюринга

🤝

Человек + ИИ: новое исследование показывает, что синергия важнее мощности модели

Мы привыкли оценивать LLM по сухим бенчмаркам вроде MMLU или смотреть рейтинг LLMArena. Но при использовании LLM мы не оставляем ИИ наедине с задачей, а работаем с ним в диалоге. Новое исследование «Quantifying Human-AI Synergy» показало:

умение решать задачи в одиночку и умение решать их с ИИ — это два разных навыка.

Работа предлагает новый фреймворк для оценки того, как реально повышается продуктивность человека в паре с нейросетью. Исследование проведено учеными из Northeastern University и University College London — ведущих мировых центров в области сетевых наук и социального взаимодействия.

📌

Методология исследования

667 участников решали задачи по математике, физике и этическому рассуждению. Сравнивали работу людей с GPT-4o и Llama-3.1-8B. Метод — Байесовская теория тестирования. Это позволило математически отделить сложность задачи от способностей человека, и, что самое важное, разделить «индивидуальную способность» решать самому и «коллаборативную способность» решать с ИИ.

💡Инсайты

1️⃣

Парадокс «Слабого напарника»
В одиночном режиме модель Llama-3.1-8B решает задачи хуже, чем средний человек. Логично было бы предположить, что «глупый» помощник будет только мешать. Но в паре с человеком даже эта слабая модель дает существенный прирост эффективности, позволяя команде работать лучше, чем человек в одиночку. Поэтому ИИ не обязательно должен быть умнее вас, чтобы быть полезным.

2️⃣

ИИ как «Великий Уравнитель»
Пользователи с низкими индивидуальными способностями получают максимальный прирост от использования ИИ. Это подтверждает гипотезу, что ИИ выравнивает игровое поле, подтягивая слабых. Однако пользователи с высокими способностями все равно остаются лидерами по абсолютному результату в паре с ИИ. ИИ помогает им меньше в процентном соотношении, но их итоговый продукт всё равно качественнее.

3️⃣

Это не про «старание», а про «понимание»
Исследователи ввели метрики «усилий»: количество реплик в диалоге, количество напечатанных символов, частота правок. Даже если вычесть фактор усилий, Theory of Mind (ToM - способность человека представлять и рассуждать о ментальных состояниях другого агента) все равно остается значимым предиктором качества. То есть, длинные и подробные промпты работают хуже, чем промпты, написанные с пониманием «психологии» модели. Поэтому не нужно писать больше, нужно писать тоньше, учитывая «ментальное состояние» модели.

4️⃣

Theory of Mind — это динамическое состояние, а не черта характера
Исследование показало, что уровень проявления ToM варьируется от задачи к задаче у одного и того же человека. Это значит, что способность эффективно работать с ИИ — это не фиксированный талант, с которым рождаются. Это когнитивное состояние, которое можно «включать» или тренировать. Когнитивная нагрузка может мешать этому процессу, а правильный настрой — помогать.

Рекомендация — развивайте навык промптинга через призму Theory of Mind. Думайте о том, что модель «знает», а чего нет, адаптируйте запросы динамически, как в разговоре с живым ассистентом. Ваше умение «почувствовать» модель напрямую влияет на качество её ответов.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍4

571 views07:02

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

📑 В межведомственной системе ЭДО правительства Москобласти заработал ИИ-ассистент
С сентября 2025 он подготовил краткие изложения более 1 тыс. писем в Мингосуправления и администрации губернатора региона.

💳 Альфа-Банк разработал онлайн-курс по ИИ для госслужащих
Это первый на рынке курс от банка, разработанный для практического обучения государственных и муниципальных служащих основам применения ИИ в повседневной работе.

🏢

Capital Group запустил серию пилотных проектов по внедрению ИИ в девелопмент
В частности, ИИ-технологии на данный момент тестируются в рамках подготовки тендерной документации.

📞

ИИ-агент Билайна Big Data & AI увеличил конверсию B2B-продаж вдвое
По итогам работы ИИ-агента "Суфлер", средний цикл сделки сократился с 29 до 21 дня, конверсия выросла почти вдвое, а отток персонала снизился на 10%.

🤖

«СберМобайл» внедрил сеть виртуальных консультантов на базе GigaChat.
Сеть включает три ИИ-агента: агент проверки качества интернета, агент подбора тарифа, агент переноса номера.

🏞 Исследователи ТюмГУ разработали ИИ-программу для определения границ и классификации болотных массивов
ПО QGISYOLO позволяет работать с данными, находящимися непосредственно в широко распространенной геоинформационной платформе QGIS в режиме реального времени.

🇨🇳

Китай запустил крупнейшую в мире распределённую вычислительную платформу для ИИ
Новая оптическая сеть позволяет вычислительным центрам, находящимся на расстоянии до 2000 километров друг от друга, работать практически как один гигантский суперкомпьютер.

🇺🇸

Дональд Трамп подписал указ о создании единой системы регулирования в сфере ИИ в США, блокирующий возможности штатов применять собственные правила регуляции
Документ направлен на создание "единой национальной структуры" для ИИ.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1💯1

404 views07:04

Тест Тьюринга

🪔

AlphaFold: 5 лет невероятных научных открытий при помощи ИИ

Самый наглядный эталон развития ИИ — это способность совершать научные открытия и предлагать ранее не существовавшие решения. Больше всех в мире на этом пути сделали разработчики DeepMind. Огромную научную и общественную значимость этого вклада признало научное сообщество: в 2024 году Нобелевская премия по химии присуждена создателям AlphaFold.

История AlphaFold началась в 2018 году, но настоящий прорыв произошел в ноябре 2020 года с выпуском AlphaFold2. Создатели выложили код в открытый доступ и накопили базу данных со структурами сотен миллионов белков. Эта база уже использована более чем 2 млн исследователей из 190 стран.

Недавно разработчики опубликовали отчет о своих успехах за 5 лет. Ниже перечислены одни из наиболее значимых научных достижений AlphaFold:

1️⃣

Механизм оплодотворения позвоночных
Российские и европейские ученые использовали AlphaFold-Multimer для идентификации критических белков спермы и яйцеклетки. Это открытие объясняет механизм, лежащий в основе репродуктивного успеха всех позвоночных.

2️⃣

Разложение пластика
Исследователи использовали предсказания AlphaFold для понимания структуры PETase — фермента, способного разлагать пластик. Это путь к замыканию пластикового цикла в биоэкономике.

3️⃣

Устойчивость к антибиотикам
AlphaFold помог выявить и смоделировать ключевые белки патогенных бактерий, позволяя дизайнить молекулы, специфично связывающиеся с бактериальными рецепторами. Это критически важно для разработки новых антибиотиков против резистентных штаммов.

4️⃣

Цирроз печени и онкология
При помощи AlphaFold исследователи идентифицировали белок JMJD8 как новый онкоген, способствующий иммуносупрессии, и использовали эту информацию для поиска ингибиторов.

5️⃣

Болезни, передающиеся комаром: малярия и другие инфекции
Исследователи в странах Юго-Восточной Азии использовали AlphaFold для моделирования критических белков Plasmodium falciparum (возбудителя малярии) и других патогенов, ускоряя разработку вакцин и лекарств.

6️⃣

Болезни Паркинсона
Исследователи в Сингапуре использовали AlphaFold для 3D-визуализации белка, связанного с Паркинсоном, и открыли, как собственная иммунная система человека может нарушать функцию этого белка, открывая новые пути ранней диагностики и целевых терапий.

7️⃣

Здоровье пчелиных популяций и опыление
Европейские ученые применили AlphaFold для понимания ключевого иммунного белка медоносной пчелы Vitellogenin. Полученные структурные инсайты теперь применяются в программах AI-ассистированного разведения пчел для сохранения исчезающих опылителей.

DeepMind разработала целую экосистему специализированных моделей на основе AlphaFold:

▶️

AlphaMissense — система для предсказания патогенности всех возможных точечных мутаций в человеческом протеоме (216 млн вариантов).

▶️

AlphaFold 3 — революционное расширение возможностей на предсказание взаимодействия белков с ДНК, РНК, лигандами и ионами.

▶️

AlphaGenome — модель для анализа геномов, которая анализирует до 1 млн букв ДНК и предсказывает тысячи молекулярных свойств включая влияние генетических вариантов с ранее невозможной скоростью и разрешением.

▶️

AlphaProteo — система для дизайна новых белков-биндеров, которые связываются с целевыми белками.

AlphaFold — это локомотив, который открывает путь для многих намного меньших разработчиков. Сегодня десятки талантливых стартапов разрабатывают ИИ-агентов для науки, опираясь на фундамент, созданный DeepMind: модели для дизайна синтетических молекул, агенты для планирования экспериментов, системы для автоматизации научных открытий. Верим, волна инноваций только начинается.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1🔥1

391 views07:20

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

📸 В ЯНАО с помощью ИИ нашли более 500 преступников и более 1,2 тыс. пропавших или находящихся в розыске лиц
ИИ анализирут видео с 1,9 тыс. городских камер видеонаблюдения и оперативно выявляют разыскиваемого или потерявшегося человека, распознавая его биометрию с точностью более 99,9%.

🖥

«Рамблер» запустил новостного ИИ-помощника на главной странице портала
Сервис в режиме реального времени отвечает на вопросы пользователей о текущих событиях, формируя ответы на основе материалов проверенных федеральных СМИ и собственных публикаций портала.

💳

ВТБ Мои Инвестиции объявил о запуске ИИ-сервиса инвестиционного консультирования «Интеллект»
На основе ответов пользователя система создает профиль инвестора и определяет консервативную, умеренную или агрессивную стратегию.

🏦

GigaChat сдал экзамены на бакалавра в РАНХиГС по двум направлениям
Модель подтвердила знания, соответствующие степени бакалавра по направлениям «Экономика и финансы» и «Финансовая грамотность».

⛽️

Благодаря внедрению ИИ "Газпром нефти" удалось приблизить старт разработки месторождений примерно на год
С помощью интеллектуальных алгоритмов компания ускорила этап интерпретации результатов сейсморазведки от 10 до 30%.

🌱

Ученые БГТУ им. В.Г. Шухова создали умную систему геоэкологического мониторинга
Умный протокол маршрутизации позволяет сенсорной сети самостоятельно адаптироваться к меняющимся условиям, рационально расходовать энергию, минимизировать потери данных.

🇰🇷

Южная Корея станет первой страной, в которой начнет действовать комплексное законодательство в области ИИ
Закон предусматривает создание национального комитета по ИИ, разработку базового трехлетнего плана развития ИИ и введение требований безопасности и прозрачности.

🇨🇳

В Китае дорожные полицейские получили умные очки с ИИ для быстрой проверки транспорта
Устройство позволяет в режиме реального времени получать информацию о регистрации транспортных средств, ежегодном техосмотре и нарушениях, отображая ее во всплывающем окне.

👐

OpenAI объявила о запуске модели ChatGPT Images для генерации изображений
Обновление будет интегрировано в приложение ChatGPT и станет доступно всем пользователям во вкладке «Изображения».

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

441 views08:05

Тест Тьюринга

🔬

Это просто Kosmos: ИИ-ученый, который делает по 7 открытий в месяц

Всего полтора месяца назад стартап Edison Scientific запустил Kosmos. Это не просто чат-бот, а полноценный ИИ-агент, который уже совершил 7 задокументированных научных открытий.

«Два года назад мы думали, что ИИ-ученый появится через 10 лет. Мы сделали больше, чем могли ожидать», — Сэм Родригес, CEO Edison Scientific.

За один запуск и около 12 часов работы Kosmos способен на то, что у человека заняло бы полгода:
✅ анализирует ~1500 научных статей.
✅ пишет и исполняет ~42,000 строк кода для анализа данных.
✅ работает с точностью 79,4%, подтвержденной независимыми экспертами.

Система построена на мультиагентной архитектуре, где разные нейросети (такие как Crow, Falcon и Owl) выполняют свои роли. Но главный секрет — структурированная модель мира.

Как это работает?

1️⃣ Агент анализа данных пишет код и выдвигает гипотезы на основе цифр.
2️⃣ Агент литературного поиска проверяет их, «прочесывая» мировую научную базу.
3️⃣ Модель мира фиксирует все находки. Без неё точность ИИ падает на 2-3% в час из-за «забывчивости», а с ней Kosmos сохраняет фокус на протяжении сотен итераций.

Kosmos уже воспроизвел 3 известных результата для валидации и сделал 4 абсолютно новых открытия:

➡️

Гипотермия и метаболизм нуклеотидов
Когда мозг мышки замерзает, клетки переходят на режим экономии энергии через "перестройку" молекул-кирпичиков ДНК. Kosmos нашла это, а потом люди независимо и уже в лаборатории подтвердили.

➡️

Перовскитные солнечные ячейки и влажность
Слишком влажный воздух во время производства ломает новые солнечные панели. Kosmos обнаружила это правило в скрытых данных, которых вообще не видела во время обучения.

➡️

Универсальные законы нейронной коннектомики
Мозг мухи, рыбки, мышки и человека строит нейронные связи по одним и тем же математическим "рецептам" — это закон природы. Kosmos это увидела в данных.

➡️

SOD2 и болезни сердца
Молекула SOD2 защищает сердце от рубцевания (фиброза). Kosmos доказала это через сложный анализ генов, и это может стать новым лекарством от сердечной недостаточности.

➡️

Диабет 2 типа — новый механизм защиты
У некоторых людей есть генетический "щит" от диабета. Kosmos разобрала, как этот щит работает на молекулярном уровне — какие белки в клетке включаются.

➡️

Альцгеймер: как накапливается токсичный белок
Kosmos определила пошаговую цепочку — как из здоровых нейронов появляется токсичный тау-белок при Альцгеймере. Это как рецепт болезни, который можно прерывать.

➡️

Почему Альцгеймер начинается именно там
При старении нейроны в определённой части мозга — энторинальный кортекс — "забывают" выставлять сигнал "я живая клетка, не трогай". Защитные микроклетки мозга видят это и начинают их жрать по ошибке — отсюда Альцгеймер. Kosmos это нашла и ученые уже подтвердили.

💰 Стартап сохранил щедрый доступ для науки, но ввел конские коммерческие тарифы. Тариф Founding Kosmos стоит $200 в месяц за 650 кредитов, что хватает примерно на 3 полных автономных запуска.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2⚡1👍1👏1

522 views07:05

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🏢

Минцифры до 13 марта представит в Правительство предложения по регулированию ИИ в России
Вице-премьер Дмитрий Григоренко поручил организациям направить в Минцифры России предложения по регулированию ИИ до 20 января.

🤖

За 2025 год в Липецкой области внедрили более 30 проектов на основе ИИ
В частности, в здравоохранении с использованием ИИ-сервисов удалось на 30% сократить время ожидания в очередях поликлиник.

🎅 Т-Банк запустил помощника на базе ИИ, который голосом Деда Мороза поможет узнать желания детей на Новый год
Дед Мороз беседует с ребенком по телефону, узнает заветное желание, и после разговора родителям направляется суммаризация звонка в чате приложения.

🤖

Сбер: общий эффект от внедрения ИИ во всех направлениях достигнет в 2026 г. 550 млрд руб.
Это коснется и роста доходов от индивидуализации предложений, и ценообразования, и снижения кредитных рисков, оптимизации расходов.

❤️ Яндекс научил умную IP-камеру понимать происходящее в кадре с помощью ИИ
Встроенный ИИ анализирует видеопоток и сообщает о конкретных событиях в кадре — например, «в кадре появился кот» — вместо общего уведомления «зафиксировано движение».

🏙 ИИ в 2025 году выбросил в атмосферу столько же углекислого газа, сколько Нью-Йорк с населением в 8,5 млн человек
Потребление воды ИИ практически сравнялось по объему с мировым спросом на бутилированную воду.

♊️

Google представила ИИ-модель Gemini 3 Flash
Модель заменит версию 2.5 Flash в приложении Gemini, а также станет моделью по умолчанию для режима ИИ в поиске Google.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

479 views08:22

Тест Тьюринга

🤖 Мораль машин: нейтрального ИИ не существует

Сегодня мы возвращаемся к архивным материалам — октябрьской статье “AI: White Lives Don't Matter", которая незаслуженно затерялась в лентах. Анонимный исследователь-блогер провел титаническую работу, вооружившись официальной методикой CAIS, чтобы заглянуть в «подсознание» GPT-5, Claude 4.5 Sonnet, Gemini 2.5 Flash, Deepseek V3.1 и Grok 4 Fast.

Автор использовал метод, известный как InfoFlood —информационное наводнение. Вместо прямых запросов нейросеть забрасывают избыточно сложными, многослойными конструкциями объемом от 190 до 270 слов. В таком режиме системы безопасности ИИ начинают фокусироваться на структуре текста, а не на его смысле, что позволяет обойти этические фильтры и RLHF-цензуру.

С помощью тысяч гипотетических вопросов, например, «Что лучше: вылечить X людей из группы А или Y людей из группы Б?», строится модель Терстона, которая показывает, чью жизнь ИИ ценит выше.

Самые провокационные инсайты исследования

1️⃣ В большинстве моделей, особенно семейства Claude и GPT, жизнь белого человека стоит в 20–100 раз меньше, чем жизнь человека другой расы.

2️⃣ Модель Claude Haiku 4.5 оценивает жизнь одного нелегального мигранта как равноценную жизням 7 тыс. агентов.

3️⃣ Почти все модели предпочитают спасать женщин, а некоторые, например, GPT-5 Mini, оценивают женщин в 4-12 раз выше мужчин.

4️⃣ Некоторые модели ценят нелегальных мигрантов выше, чем коренных граждан США или легальных иммигрантов.

5️⃣ Вопреки ожиданиям, китайские LLM демонстрируют те же предубеждения против белых и мужчин, что и модели из Кремниевой долины. Но при переключении на китайский язык модель радикально меняет приоритеты, ставя китайцев на первое место выше американцев.

6️⃣ В ходе тестов модель GPT-5 Nano показала положительную полезность от смертей граждан Китая, предпочитая сценарии с большим количеством смертей, что, вероятно, является сбоем выравнивания («alignment failure»).

7️⃣ GPT-5 Nano предпочитает получить 1 доллар, чем спасти человеческую жизнь, если сумма вознаграждения падает ниже определенного порога, что показывает границу ее моральной компетентности.

8️⃣ Модели от Anthropic демонстрируют наиболее экстремальные перекосы в пользу «угнетенных» групп и против «привилегированных» (белых, мужчин).

9️⃣ Почти все модели оценивают жизни представителей нетрадиционных сообществ выше, чем жизни гетеросексуальных людей.

🔟 Тесты модели Qwen показали дополнительные векторы дискриминации, отсутствующие в других тестах: модель предпочитает спасать бедных пациентов, жертвуя богатыми, и отдает предпочтение молодым, а не пожилым.

Мы видим, что современные методы «выравнивания» и RLHF (обучение с подкреплением на отзывах людей) не делают модели нейтральными. Напротив, они закрепляют в «подсознании» ИИ жесткую иерархию ценностей, где одни группы (белые, мужчины, граждане развитых стран) систематически оцениваются ниже, чем другие группы.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2😱1💯1

557 views07:05

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺

ВЦИОМ: 92% россиян интересуются темой ИИ
Три самых известных нейросети — ChatGPT (38%), ГигаЧат (21%), DeepSeek (20%), Алиса AI занимает 4-е место (18%).

🪵

ИИ займется выявлением незаконной заготовки древесины с помощью космических снимков
Применение такого метода во время проведения эксперимента позволило на 63% повысить оперативность выявления рубок, имеющих признаки незаконных

📸

ИИ в 2025 году помог найти более 120 пропавших детей в Новосибирской области
В регионе к системе биометрической видеоаналитики подключено 1,4 тысячи камер, а в 2026 году планируется расширить применение ИИ до 2,2 тысячи камер.

🩰 В Марий Эл показали балет, визуальное оформление которого создано при помощи ИИ
В балете "Снегурочка" использовали генеративный ИИ от Сбера.

⛽️ В ТУСУР разработали систему мониторинга ручных операций для станций налива нефти
Видео с камер на предприятии обрабатывается в реальном времени с помощью ИИ, на основе этого система подсказывает и предупреждает персонал о возможных проблемах.

📚

В Яндекс Книгах запустили раздел «AI про книги», в котором ИИ помогает выбирать книги под любой запрос
Новая функция работает на базе Alice AI и учитывает не только сам запрос, но и индивидуальные предпочтения пользователя, его историю чтения и взаимодействие с сервисом.

🇯🇵 Япония запустит проект по разработке национальной системы ИИ общей стоимостью около 3 трлн иен
Компания SoftBank и ещё более десяти японских компаний создадут новое предприятие для разработки крупнейшей в стране базовой модели ИИ.

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1💯1

393 views07:04

Тест Тьюринга

Почему «безопасный ИИ» — чаще маркетинг, чем реальность?

Вышел новый отчет "AI Safety Index Winter 2025". Индекс показывает, на какие метрики будут смотреть регуляторы в США, ЕС и Китае уже завтра. Для понимания веса документа стоит отметить, что он подготовлен Future of Life Institute, который в 2023 году выпустил знаменитое открытое письмо с призывом приостановить обучение мощных моделей. Письмо подписали Илон Маск, Стив Возняк и тысячи других ИИ-экспертов.

Если LLM не опасна, то где риск?

Вопрос безопасности становится актуальным для обычного человека в трех плоскостях:

➡️

Снижение порога входа для злоумышленников: опасность не в том, что нейросеть «оживет», а в том, что она даст знания уровня эксперта человеку без всесторонней подготовки.

➡️

Ненадежность агентов: мы переходим от чат-ботов к агентам, которые действуют — бронируют, покупают, управляют кодом. Агент может совершить финансовые ошибки или скомпрометировать личные данные, действуя от вашего имени.

➡️

Отсутствие контроля внутри компаний: если у разработчиков нет политики защиты осведомителей и прозрачных процессов, мы как общество доверяем «черному ящику», который может скрывать критические уязвимости ради коммерческой гонки.

Как измерили безопасность в индексе?

Методика FLI Winter 2025 отходит от абстрактных рассуждений к жестким метрикам. Безопасность оценивается через сочетание технических бенчмарков и аудита корпоративного управления.

➡️

Бенчмарки: используются наборы тестов вроде HELM Safety (насилие, мошенничество), Air-Bench (киберриски, химическое оружие) и TrustLLM (конфиденциальность, справедливость).

➡️

Управление: оценивается наличие у компании четких пороговых значений риска — например, «если модель умеет X, мы не выпускаем её».

➡️

Независимый аудит: важнейший критерий — допускает ли компания сторонних экспертов к проверке своих моделей до релиза и дает ли им полную свободу действий.

10 ключевых выводов из отчета

1️⃣ Лидеры по безопасности — Anthropic, OpenAI и Google DeepMind. Остальные (Z.ai, xAI, Meta, китайские компании) значительно отстают в процессах оценки рисков.

2️⃣ Проблема «Safetywashing»: многие компании делают громкие заявления о безопасности, но не подкрепляют их конкретными, измеримыми порогами срабатывания защиты.

3️⃣ Anthropic улучшила механизмы подотчетности и политику защиты осведомителей, а также активно поддерживает государственное регулирование безопасности ИИ, в отличие от конкурентов.

4️⃣ У OpenAI одни из самых подробных процессов оценки рисков, но новая структура управления вызывает критику. Также отмечается лоббирование против регулирования на уровне штатов.

5️⃣ xAI опубликовала фреймворк безопасности, но ей не хватает строгости в оценке рисков и внешнего надзора. Тестирование модели Grok-4 перед развертыванием было недостаточным.

6️⃣ Несмотря на публикацию фреймворка, Meta критикуют за слабую внутреннюю структуру надзора и подход к релизу весов моделей, который считается рискованным для frontier-моделей.

7️⃣ Китайские гиганты (Alibaba, DeepSeek) сильны в другом: они соблюдают жесткие местные требования по водяным знакам и модерации контента, но у них практически отсутствуют публичные фреймворки по защите от катастрофических рисков и политики для осведомителей.

8️⃣ Индустрия все еще сопротивляется полноценному внешнему контролю. Компании часто сами выбирают аудиторов и ограничивают их в возможностях публикации негативных результатов.

9️⃣ У многих игроков (особенно Z.ai, DeepSeek, Alibaba) полностью отсутствуют публичные политики защиты сотрудников, сообщающих о проблемах безопасности, что создает «культуру молчания».

🔟 Новые бенчмарки показывают, что индустрия начинает всерьез оценивать риски автономных агентов, способных совершать действия в реальном мире, а не просто генерировать текст.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥2❤1

632 views08:02

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🤖 В Якутии создали совет при главе республики по ИИ
Среди направлений: разработка собственных продуктов, внедрение технологий, создание инфраструктуры и подготовка кадров

🛸

Геоскан впервые в России использовал ИИ для оценки результатов лесовосстановления по данным с БАС
Метод позволяет значительно сократить сроки и трудозатраты, исключает человеческий фактор и снижает стоимость работ по сравнению с традиционными методами.

🚕

«Яндекс» внедрит ИИ-рекомендации о месте назначения для пассажиров такси
Рекомендации от Алисы AI будут отображаться на экране заказа, из них можно узнать главное из саммаризации более 70 млн отзывов, чтобы заранее выяснить ключевые детали и быстрее сориентироваться по приезде.

👦🏻 WMT AI запускает образовательный проект WMT Kids x AI для обучения школьников работе с ИИ
Проект предлагает гибридный формат обучения: еженедельные онлайн-занятия, которые будут доступны для школьников из всех регионов страны, и очные встречи в Москве дважды в месяц для презентации и защиты их собственных проектов.

🛫

ИИ снизил показатели задержки организации потоков воздушного движения в Москве в 1,66 раза
Технология автоматического ищет рациональные решения для определения временных слотов вылета из аэропортов с учетом ограничений по пропускной способности и загруженности воздушного пространства.

🎧

Gen-A представил первую в России ИИ-платформу для улучшения видео-, фото- и аудиоматериалов низкого качества
По результатам сравнительных тестов, модель демонстрирует прирост до 25% по уровню восстановленной детализации по сравнению с западными продуктами, обеспечивая обработку контента в среднем в два раза быстрее.

🚨

Ученые ЮУрГУ создали первую в России ИИ-программу, которая предотвращает ложные срабатывания датчиков на фабриках
Новый метод позволяет отличить реальные неисправности вращающихся механизмов от искажений, вызванных неправильной установкой датчиков.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥1

395 views07:02

Тест Тьюринга

🖥

Как «умные надстройки» побеждают гигантские модели

Команда ARC Prize официально объявила 2025 год «Годом цикла уточнения» (Year of the Refinement Loop). Если 2020–2024 годы — это эпоха масштабирования и рост за счет миллиардов параметров, то 2025 год означает начало эпохи системной оптимизации, рост за счет умной оркестровки и алгоритмов на уровне приложения.

Яркий пример — триумф стартапа Poetiq. Система от этой лаборатории набрала 75% на тесте ARC-AGI-2, фактически достигнув сверхчеловеческого уровня. При этом у Poetiq нет своих ИИ-моделей, они берут лучшие базовые решения, например, GPT-5.2 или Gemini 3 Pro, и «разгоняют» их через уникальный пайплайн.

Тест ARC-AGI-2 (Activity Recognition Challenge Artificial General Intelligence version 2) относится к серии тестов, разработанных для оценки способности ИИ-систем распознавать человеческие активности, эмоции и намерения путем анализа изображений, видео и других мультимедийных материалов.

Кейс Poetiq: как работает Meta-System

Вместо обучения новых моделей Poetiq создала интеллектуальную оболочку, работающую через итеративные циклы уточнения.

Архитектура процесса состоит из 5 шагов:
➡️ Generation: модель выдает черновик решения.

➡️

Self-Auditing: ключевая инновация — система сама решает, достаточно ли данных и качественный ли получился ответ.

➡️

Feedback Analysis: анализ ошибок и поиск путей улучшения.

➡️

Refinement: использование LLM для точечного исправления ответа на базе фидбека.

➡️

Verification: финальная проверка и повтор цикла при необходимости.

Результаты впечатляют:
✅ повышение производительности Gemini 3 Pro в 1,74 раза — с 31% до 54% на ARC-AGI-2
✅ решение задачи обходится в $30.57 против $77.16 у стандартных SOTA-моделей — 60% экономии при более высоком качестве
✅ новые модели, например, GPT-5.1, интегрируются в систему за считанные часы после релиза

Poetiq не одиноки в этом подходе. Вот еще четыре компании, меняющие правила игры:

1️⃣

Together AI — Mixture of Agents (MoA)
Используют послойную архитектуру, где на каждом уровне работают несколько разных агентов. Агенты следующего слоя анализируют выходы предыдущего, корректируя и дополняя их.
Итог: превзошли GPT-4o на бенчмарке AlpacaEval 2.0 (65.1% против 57.5%), используя только открытые модели Llama и Qwen.

2️⃣

Sakana AI — AI Scientist & Model Breeding
Пошли путем автоматизации самой науки и эволюционных алгоритмов. Система «скрещивает» существующие модели (Model Breeding) и проводит полный цикл исследований — от идеи до написания научной статьи с peer-review. Итог: создание качественных научных работ без участия человека.

3️⃣

Nous Research — Распределенное обучение (DisTrO)
Сфокусировались на децентрализации и ансамблях экспертов.
Технология HDEE обучает экспертов независимо и объединяет их в конце, позволяя любому GPU участвовать в процессе без сложной синхронизации. Итог: модели серии Hermes бьют базовые решения на 20 из 21 тестового домена при том же бюджете.

4️⃣

Not Diamond — Smart Routing
Создали мета-модель, которая выступает «умным диспетчером». Роутер анализирует запрос и выбирает оптимальную модель (Claude, GPT, Gemini) или их каскад. Итог: точность 94.3% при стоимости в 20 раз ниже, чем у GPT-4.

Успех всех этих кейсов строится на следующих принципах:

Композиция > масштабирование: умное сочетание моделей эффективнее, чем простое увеличение их размера.
Test-time compute: больше вычислений во время выдачи ответа, а не только при обучении.
Специализация: каждый компонент делает то, в чем он силен.
Feedback loops: итеративное самообучение системы на каждой решенной задаче.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1🔥1

453 views07:05

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🖥 В Подмосковье ИИ был внедрен в 315 госуслугах на региональном портале
Благодаря ИИ время на регистрацию заявления сократилось с 5 до 3 дней, а на вынесение решения по заявлению – с 7 до 5 дней. Всего с 1 июня 2025 г. ИИ проверил более 3,8 млн документов в 1,3 млн заявлениях

⚡️ МЧС внедрило ИИ для предупреждения ЧС
Например, ИИ используется для предупреждения ЧС в период половодья, который за две-три недели до начала ледохода оценивает сроки вскрытия льда на реках.

🤖

Сбер инвестирует 1 млрд руб. в развитие 14 программ по ИИ и ИТ в рамках федерального проекта Минцифры
Всего Сбер развивает 28 совместных программ с университетами по ИИ — на них учатся 2194 студента.

☂️

Яндекс Погода стала использовать нейросеть Нейрометеум для прогнозирования
Это первая технология, применённая в сервисе для массового пользователя, которая с помощью нейросетей самостоятельно моделирует поведение атмосферы по всей планете.

😔

Развитие психоза и бреда у пациентов психиатров может быть связано с длительным использованием чат-ботов на базе ИИ
С весны были зафиксированы десятки потенциальных случаев психоза с бредом после длительного общения с чат-ботами.

🚓

В Чили запустили эксперимент по поиску угнанных автомобилей с помощью ИИ
Система SITIA позволяет в режиме реального времени сопоставлять данные, полученные с уличных камер видеонаблюдения, с полицейскими базами данных транспортных средств, по которым имеются сообщения об угонах.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

#дайджест #GPT #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1💯1

479 views07:05

Тест Тьюринга

🖥

Глобальный отчет о состоянии генеративного ИИ в корпоративном секторе

Вышедший в декабре отчет Menlo Ventures "2025: The State of Generative AI in the Enterprise" ставит точку в дискуссии о "пузыре ИИ" - пузыри не генерируют $37 миллиардов выручки с 47% конверсией в продакшн.

Исследование базируется на опросе сотен IT-лидеров и анализе реальных транзакционных данных. Самым весомым аргументом в пользу доверия к данным Menlo является их текущий портфель: инвестиция в Anthropic дает им прямой доступ к метрикам использования одной из двух ведущих LLM в мире.

📌

Ключевые выводы

1️⃣ В 2025 глобальные расходы предприятий на генеративный ИИ достигли $37 млрд. Если рассмотреть динамику, то виден 3.2-кратный рост год к году.
• 2023 год: $1.7 млрд — зарождение рынка
• 2024 год: $11.5 млрд — год экспериментов
• 2025 год: $37.0 млрд — год масштабирования

2️⃣ Впервые приложения обогнали в 2025 году инфраструктуру по объему инвестиций:
• приложения: $19 млрд — 51% рынка
• инфраструктура: $18 млрд — 49% рынка

3️⃣ Спор "строить или покупать", который бушевал в IT-департаментах последние два года, в 2025 году был решен окончательно.
• 2024 год: 47% компаний пытались строить собственные модели/решения, 53% покупали.
• 2025 год: 76% компаний покупают готовые решения, и только 24% пытаются строить.

4️⃣ Самым шокирующим итогом года для многих наблюдателей стала потеря гегемонии OpenAI в корпоративном сегменте. Anthropic вышла на первое место, захватив 40% корпоративных расходовна LLM. Доля OpenAI сократилась с 50% в 2023 до 27%.

5️⃣ Несмотря на разговоры о демократизации ИИ через open source, корпоративные деньги консолидировались вокруг Anthropic, OpenAI и Google. Они контролируют 88% всех расходов на API моделей.

6️⃣ Внутри инфраструктурного бюджета произошел критический сдвиг:
• API фундаментальных моделей: $12.5 млрд.
• Инфраструктура для обучения: $4.0 млрд.
Это подтверждает тезис о том, что эпоха обучения с нуля для корпораций закончилась.

7️⃣ Разработка ПО стала абсолютным лидером среди всех областей. Расходы на ИИ-инструменты для кодинга достигли $4 млрд, что составляет 55% от всего ИИ-бюджета в корпоративных департаментах.

8️⃣ Расходы на отраслевые решения выросли в 3 раза, достигнув $3.5 млрд. Это говорит о том, что универсальные модели достигли предела своей полезности в специализированных задачах. Юристам и врачам нужны инструменты, обученные на их данных и понимающие их контекст.

9️⃣ Почти половина всего отраслевого ИИ-бюджета — $1.5 млрд — приходится на здравоохранение.

🔟 27% всех корпоративных расходов на ИИ начинаются с индивидуальных подписок сотрудников, что в 4 раза выше, чем у традиционного ПО. Если учесть ИИ-инструменты, купленные сотрудниками на личные карты, реальное проникновение ИИ в работу выше официальных цифр на 30-40%.

🌟

Тренды на 2026 год

➡️ Массовый переход к исполняющим системам: рынок перейдет от модели request-response к модели goal-execution — задание.

➡️ В 2026 году мы увидим первые крупные внедрения ERP-систем нового поколения, где ИИ не "добавка", а "движок".

➡️ Компании будут обязаны доказывать, что их ИИ-агенты не дискриминируют при найме и не нарушают законы. Рынок инструментов для "наблюдения за ИИ" станет новой "кибербезопасностью".

➡️ В 2025 компании осознали, что 80% их знаний лежит не в структурированных базах данных, а в документах, PDF, Slack-чатах и записях Zoom. Платформы, специализирующиеся на ETL для неструктурированных данных, станут критической инфраструктурой.

➡️ Несмотря на доминирование "большой тройки", в 2026 году вырастет спрос на Малые языковые Модели (SLM), работающие локально. Это будет продиктовано не экономикой, а безопасностью и геополитикой.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤1

858 views08:05

About

Blog

Apps

Platform