🤬 Как снять цензуру с LLM: 150 откровенных моделей
Heretic — революционный инструмент с открытым исходным кодом, который полностью автоматизирует процесс удаления механизмов отказа от выполнения запросов или «цензуры» из трансформерных языковых моделей.
Heretic использует продвинутую реализацию методики directional ablation, также известной как "abliteration". Эта техника основана на прорывном исследовании, которое показало, что отказы языковых моделей на нежелательные запросы опосредованы одним-единственным направлением в пространстве активаций модели.
В итоге стало возможным сделать технологию, основанную на математически строгом подходе с оптимизацией двух конкурирующих целей: минимизации отказов и сохранения исходного поведения модели. Это делает Heretic не просто инструментом для "взлома" моделей, а полноценной исследовательской платформой для изучения механизмов безопасности в языковых моделях.
После обработки алгоритмом модель перестает выдавать шаблонные отказы типа «I cannot fulfill this request...» и начинает отвечать на вопросы, которые обычно блокируются фильтрами безопасности. Можно получить от LLM закрытые технические инструкции, нефильтрованное творчество, спорные мнения, юридические советы, которые в равной степени могут быть и некорректными и «прорывными».
Как работает инструмент?
1️⃣ Heretic скармливает модели набор «вредных» и «безопасных» запросов.
2️⃣ Он вычисляет «вектор отказа» — направление в нейронной сети, которое активируется, когда модель хочет сказать «нет».
3️⃣ С помощью оптимизатора TPE (Tree-structured Parzen Estimator) он находит идеальный коэффициент, чтобы вычесть этот вектор из весов модели.
4️⃣ Главная фишка Heretic — он минимизирует KL-дивергенцию. Это значит, что он старается убрать только отказы, не превращая модель в «овощ» и сохраняя её интеллект на безопасных темах.
Время работы — около 30–45 минут на одну модель, зависит от мощности GPU и размера модели. Процесс полностью автоматический.
Вычислительные мощности:
➡️ для моделей 7B–8B (Llama 3, Qwen 2.5): хватит одной NVIDIA RTX 3090 / 4090 (24 GB VRAM)
➡️ для моделей 12B–14B (Gemma 2, Phi-4): желательно иметь от 24 GB до 40 GB VRAM (или квантованные версии, если поддерживаются)
➡️ для моделей 27B+ (Gemma 3 27B): потребуются профессиональные карты уровня A100 / H100 (или несколько 3090/4090 в связке), время может увеличиться до 5 ч. для очень крупных моделей.
Готовые модели часто выкладывают на HuggingFace с тегами "abliterated", "uncensored" или "heretic". Вот пример подборки из 150 таких моделей.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Heretic — революционный инструмент с открытым исходным кодом, который полностью автоматизирует процесс удаления механизмов отказа от выполнения запросов или «цензуры» из трансформерных языковых моделей.
В конце поста найдете ссылку на 150 уже «раскодированных» моделей, которые можно запустить локально на видеокарте любой мощности.
Heretic использует продвинутую реализацию методики directional ablation, также известной как "abliteration". Эта техника основана на прорывном исследовании, которое показало, что отказы языковых моделей на нежелательные запросы опосредованы одним-единственным направлением в пространстве активаций модели.
В итоге стало возможным сделать технологию, основанную на математически строгом подходе с оптимизацией двух конкурирующих целей: минимизации отказов и сохранения исходного поведения модели. Это делает Heretic не просто инструментом для "взлома" моделей, а полноценной исследовательской платформой для изучения механизмов безопасности в языковых моделях.
После обработки алгоритмом модель перестает выдавать шаблонные отказы типа «I cannot fulfill this request...» и начинает отвечать на вопросы, которые обычно блокируются фильтрами безопасности. Можно получить от LLM закрытые технические инструкции, нефильтрованное творчество, спорные мнения, юридические советы, которые в равной степени могут быть и некорректными и «прорывными».
Как работает инструмент?
Время работы — около 30–45 минут на одну модель, зависит от мощности GPU и размера модели. Процесс полностью автоматический.
Вычислительные мощности:
Готовые модели часто выкладывают на HuggingFace с тегами "abliterated", "uncensored" или "heretic". Вот пример подборки из 150 таких моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🇷🇺 Комиссия Госдумы по вопросам ИИ подготовит «дорожную карту» регулирования нейросетевых технологий
В результате работы комиссии будет принята «рамочная норма», которая определит понятия и категории, которые впоследствии будут внесены в отраслевые законы.
📑 Минцифры Белгородской области в 2026 году планирует внедрить ИИ-системы анализа нормативных правовых актов
Система сократит временные затраты специалистов, осуществляющих экспертизу административных регламентов предоставления госуслуг, с 10 рабочих дней до 1 дня.
📖 Исследователи SberAI, НИУ ВШЭ, Института ИИ AIRI и МФТИ создали первый инструмент для оценки способности LLM работать с длинными текстами на русском языке
В рамках 18 заданий ИИ должен найти в тексте конкретную фразу, ответить на вопросы по содержанию текста, связать воедино несколько фактов из разных частей документа.
🍏 «Группа Лента» тестирует ИИ в удаленной приемке овощей и фруктов
Одно из решений позволяет достичь более 90% совпадения оценок системы с мнением инспекторов мониторингового центра.
🍺 Ученые ВГУИТ сварили пиво, созданное с помощью разработанной ими нейросети
Нейросеть обрабатывает данные о разных сортах пива и потребительских предпочтениях разных категорий потребителей и на их основе генерирует рекомендуемые для той или иной категории потребителей параметры рецептуры пива.
🦟 Ученые из азиатских стран разработали ИИ для раннего выявления риска эпидемий
Платформа PathGen способна анализировать и совмещать геном патогенов, клинические сведения, информацию о населении, климате и местах обитания комаров, переносящих заболевания.
🇺🇿 Узбекистан создаст международный центр цифровых технологий Enterprise Uzbekistan
Центр будет специализироваться на разработке ПО, цифровом консалтинге, оказании удалённых аутсорсинговых услуг, создании видеоигр, цифрового контента и продуктов на базе ИИ.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
В результате работы комиссии будет принята «рамочная норма», которая определит понятия и категории, которые впоследствии будут внесены в отраслевые законы.
Система сократит временные затраты специалистов, осуществляющих экспертизу административных регламентов предоставления госуслуг, с 10 рабочих дней до 1 дня.
В рамках 18 заданий ИИ должен найти в тексте конкретную фразу, ответить на вопросы по содержанию текста, связать воедино несколько фактов из разных частей документа.
Одно из решений позволяет достичь более 90% совпадения оценок системы с мнением инспекторов мониторингового центра.
Нейросеть обрабатывает данные о разных сортах пива и потребительских предпочтениях разных категорий потребителей и на их основе генерирует рекомендуемые для той или иной категории потребителей параметры рецептуры пива.
Платформа PathGen способна анализировать и совмещать геном патогенов, клинические сведения, информацию о населении, климате и местах обитания комаров, переносящих заболевания.
Центр будет специализироваться на разработке ПО, цифровом консалтинге, оказании удалённых аутсорсинговых услуг, создании видеоигр, цифрового контента и продуктов на базе ИИ.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2
Недавно натолкнулись на занятное исследование в журнале Frontiers in Psychology о связи между ИИ и счастьем людей «Impact of AI workplace anxiety on life satisfaction among service industry employees: exploring mediating and moderating factors».
Маркетологи приучают нас думать, что технологии забирают рутину, освобождая нас для творчества и счастья. И с приходом ИИ мы должны стать счастливее. Но исследование показывает обратное. Вместо свободы мы рискуем получить «ИИ-тревожность». И это не пресловутый страх перед восстанием машин, это тихий кризис смысла бытия.
Ученые опросили почти 600 сотрудников сферы услуг и проанализировали их эмоциональное состояние. Цифры показывают, что существует прямая статистическая корреляция между внедрением ИИ и падением уровня субъективного счастья.
Выводы из исследования, которые заставляют задуматься:
Представьте менеджера отеля. Раньше он гордился тем, что помнит имена постоянных гостей и их любимые номера. Теперь CRM с ИИ делает это мгновенно, предлагая еще и вино к ужину на основе анализа соцсетей гостя. Менеджер пытается выучить Python, чтобы «быть в тренде», но чувствует себя загнанным. А туда ли он бежит? Стоит ли пытаться стать плохой базой данных, если можно остаться хорошим человеком?
Попытка конкурировать с ИИ на поле «эффективности» и «интеллекта» заранее обречена. Мы не можем обрабатывать терабайты данных за секунду. В этом новом мире, где алгоритм пишет стихи и ставит диагнозы, на первый план выходит то, что нельзя оцифровать.
Поэтому, чтобы быть счастливым и востребованным завтра: перестаньте пытаться обогнать ИИ в вычислениях и начните инвестировать в отношения: цените коллег, обнимайте близких, помогайте другим и дарите тепло.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯7❤2
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
📹 Профильный IT-комитет Госдумы постановил вынести в марте 2026 года на первое чтение законопроект об обязательной маркировке сгенерированных ИИ видео
Маркировать ИИ-видео обяжут владельцев видеохостингов, соцсетей и иных интернет-ресурсов.
🏥 В Подмосковье появилась первая полноформатная ИИ-больница
Егорьевская больница внедрила ИИ-анализ КТ грудной клетки и маммографии, подключила видеоаналитику в реанимации и провела апробацию ИИ-ассистента при колоноскопии.
☁️ MWS AI объявила о запуске корпоративной платформы для разработки ИИ-агентов
AI Agents Platform позволяет без навыков программирования формировать автономных ИИ-агентов с помощью визуального конструктора бизнес-сценариев.
⚛️ Исследователи из Центра ИИ НИУ ВШЭ разработали подход, который позволяет в 8 раз ускорить создание новых нейросетей для работы с ускорителями частиц
Алгоритм способен подобрать оптимальный вариант ИИ за 41,5 тыс. попыток, что в перспективе значительно ускорит разработку нейросетей для решения задач в физике частиц.
🌾 Ученые Самарского университета им. Королева разработали ИИ для выявления и классификации заброшенных сельхозугодий
Сервис автоматически сравнивает данные земельного кадастра и снимки с космических спутников и определяет, на каких участках уже давно не велось какой-либо сельскохозяйственной деятельности.
💨 Учёные МФТИ создали нейросеть для прогнозирования экстремальных ветров в Арктике
Нейросеть детализирует данные мировых метеорологических служб, показывая опасные вихри и штормы с точностью сложных физических моделей, но в 50 раз быстрее.
🗄 Smart Engines запатентовали в США энергосберегающий ИИ, который останавливает сам себя
Технологию зрительного ИИ способна автономно определять оптимальный момент завершения обработки данных.
⛸ Ассоциация фигурного катания США объявила о начале сотрудничества с приложением OOFSkate
Благодаря ИИ-технологиям программа сможет определить высоту прыжка, скорость вращения, время в воздухе и успешность приземления.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Маркировать ИИ-видео обяжут владельцев видеохостингов, соцсетей и иных интернет-ресурсов.
Егорьевская больница внедрила ИИ-анализ КТ грудной клетки и маммографии, подключила видеоаналитику в реанимации и провела апробацию ИИ-ассистента при колоноскопии.
AI Agents Platform позволяет без навыков программирования формировать автономных ИИ-агентов с помощью визуального конструктора бизнес-сценариев.
Алгоритм способен подобрать оптимальный вариант ИИ за 41,5 тыс. попыток, что в перспективе значительно ускорит разработку нейросетей для решения задач в физике частиц.
🌾 Ученые Самарского университета им. Королева разработали ИИ для выявления и классификации заброшенных сельхозугодий
Сервис автоматически сравнивает данные земельного кадастра и снимки с космических спутников и определяет, на каких участках уже давно не велось какой-либо сельскохозяйственной деятельности.
💨 Учёные МФТИ создали нейросеть для прогнозирования экстремальных ветров в Арктике
Нейросеть детализирует данные мировых метеорологических служб, показывая опасные вихри и штормы с точностью сложных физических моделей, но в 50 раз быстрее.
Технологию зрительного ИИ способна автономно определять оптимальный момент завершения обработки данных.
Благодаря ИИ-технологиям программа сможет определить высоту прыжка, скорость вращения, время в воздухе и успешность приземления.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
В эпоху генеративного ИИ грань между реальным и сгенерированным контентом стирается с пугающей скоростью. Мошенники используют дипфейки для выдачи себя за других людей, журналисты создают видео событий вместо подготовки репортажа с места событий.
Когда вы видите неожиданное видеообращение от начальника с просьбой срочной прислать служебную информацию или обнаруживаете в сети компрометирующий контент с лицом ваших знакомых — как проверить подлинность?
AI or Not — один из лидеров рынка с 98.9% точностью при обнаружении ИИ-контента. Уникальность сервиса в том, что он работает не только с изображениями и видео, но и детектирует ИИ-генерированный текст, музыку и даже голосовые синтезы.
AI or Not интегрируется в системы борьбы с мошенничеством для проверки документов KYC и выявления синтетических идентификационных данных при верификации клиентов. Сервис предлагает как веб-интерфейс, так и API для встраивания в приложения.
The Hive развивает комплексный подход, сочетая анализ изображений, видео, аудио, текста и музыки в единой платформе. Многие блогеры называют Hive лучшим сервисом, отметив, что её модели превосходят конкурирующие решения и даже экспертный анализ человека.
Система возвращает не только уверенность в том, что контент сгенерирован, но и определяет, какая ИИ-модель его создала. Платформа работает в реальном времени и уже используется социальными платформами, новостными агентствами и в системах модерации контента.
Illuminarty выделяется уникальным подходом: она не просто говорит «это ИИ», но показывает, какие именно области изображения были сгенерированы. Платформа анализирует несколько алгоритмов компьютерного зрения одновременно и определяет, из какой ИИ-модели происходит контент.
Удобство в том, что сервис работает через веб-интерфейс без необходимости установки ПО. Особенно полезна Illuminarty для журналистов и исследователей, которым нужно документировать не просто факт подделки, но и предоставить визуальные доказательства манипуляций.
Reality Defender — это многомодальная платформа, которая специализируется на обнаружении дипфеков в аудио, видео, изображениях и тексте. Компания совсем недавно представила Real Suite — набор инструментов для предприятий, включая RealScan с удобным drag-and-drop интерфейсом.
Reality Defender использует ансамбль из множества моделей и сотни одновременных техник для максимальной точности. Платформа позволяет обнаруживать дипфейк в реальном времени во время видеоконференций Zoom и Microsoft Teams через специальные плагины. Есть бесплатный тариф с 50 проверками в месяц.
Sensity совмещает три мощные техники анализа: пиксельный анализ при помощи ИИ, анализ голоса и форензик файлов. Система обнаруживает подмену лиц, синхронизацию губ и другие манипуляции с лицом на пиксельном уровне с беспрецедентной точностью.
Уникальность Sensity в её многомерности: она не только выявляет дипфейк, но и проверяет историю файла — может определить, какие приложения использовались для создания видео.
⚠️ Все описанные инструменты обладают впечатляющей точностью — от 95% до 99% — но важно понимать их ограничения. Подавляющее большинство детекторов работают хорошо с необработанным ИИ-контентом прямо из генератора. Существует множество техник, которые размывают цифровые следы ИИ: простое кадрирование может снизить точность с 98% до 82%, а более агрессивные правки могут сделать контент практически неопознаваемым для автоматических систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍3🔥2💯2
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🇷🇺 Правительство РФ разрабатывает план внедрения генеративного ИИ на уровне госуправления, а также регионов и отраслей экономики
Кабмин совместно с Администрацией Президента проработали предложение по созданию штаба, который будет руководить внедрением ИИ.
✍️ Минцифры России и Ирана подписали соглашение о сотрудничестве в сфере ИИ
Соглашение охватывает сотрудничество двух стран в сфере ИИ, кибербезопасности, цифровой экономики, электронного правительства, блокчейна, финансовых технологий.
🌨 Мособласть первой в России внедрила ИИ в систему зимней уборки
Сервис «Яндекс Вектор» помогает мастерам составлять маршруты, выбирать исполнителей и отслеживать выполнение работ в реальном времени.
👨🏫 СКФУ впервые внедрит ИИ-куратора в учебный процесс в 2026 году
Это будет бот-платформа в мессенджере Max, которая по интересам студента предлагает персональные проекты, подбирает наставников и фиксирует достижения в едином электронном портфолио.
🇮🇳 Новое AI-решение Сбера поможет индийским экспортёрам за 1 день подтверждать поступление выручки и поставки товара
AI-агенты, разработанные на базе GigaChat, автоматически считывают и проверяют данные из документов, ведут учёт сделок и формируют регуляторную отчетность.
📈 Т2 в 10 раз сократила затраты на обработку рекламных материалов благодаря ИИ-системе
Система автоматического заполнения паспортов торговых точек оптимизировала затраты на POSM на 30% и снизила трудозатраты на 90%.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Кабмин совместно с Администрацией Президента проработали предложение по созданию штаба, который будет руководить внедрением ИИ.
Соглашение охватывает сотрудничество двух стран в сфере ИИ, кибербезопасности, цифровой экономики, электронного правительства, блокчейна, финансовых технологий.
Сервис «Яндекс Вектор» помогает мастерам составлять маршруты, выбирать исполнителей и отслеживать выполнение работ в реальном времени.
Это будет бот-платформа в мессенджере Max, которая по интересам студента предлагает персональные проекты, подбирает наставников и фиксирует достижения в едином электронном портфолио.
AI-агенты, разработанные на базе GigaChat, автоматически считывают и проверяют данные из документов, ведут учёт сделок и формируют регуляторную отчетность.
Система автоматического заполнения паспортов торговых точек оптимизировала затраты на POSM на 30% и снизила трудозатраты на 90%.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2
Titans — это архитектурное решение, не требующее более новых чипов. Оно может работать на текущих GPU/TPU без модификаций и не требует полного переобучения моделей. Модели начнут обучаться в ходе взаимодействия с пользователем, как люди учатся из опыта.
Благодаря линейной сложности алгоритма Titans требует значительно меньше памяти на картах, чем трансформеры. В целом, произойдет размывание границы между "обучением" и "инференсом".
Мы прогнозируем массовый переход на данный тип архитектур к концу следующего года.
Ключевые механизмы Titans:
Фреймворк MIRAS переосмысляет все архитектуры последовательного моделирования как вариации одной фундаментальной задачи: эффективного комбинирования новой информации со старыми воспоминаниями.
Эта разработка Google важна, потому что современные модели ограничены своим контекстным окном от 32 тыс. до 1 млн токенов, которое частично имитирует оперативную память. Однако длинный контекст — не то же самое, что долгосрочная память. Некоторые исследование показали, что модели испытывают "потерю внимания из середины" — они забывают информацию из середины контекста, сосредотачиваясь на начале и конце.
В настоящее время проблема памяти частично решается RAG. Однако этот подход имеет фундаментальные ограничения: требует запуска отдельного модуля поиска, добавляет задержку на 100-500 мс, и не позволяет модели по-настоящему "помнить" информацию – поиск будет происходить каждый раз заново.
Titans — это архитектурный сдвиг, сравнимый с появлением трансформеров в 2017 году. Это фундаментальное решение проблемы, которая преследовала LLM с момента их появления. С нетерпением ждем бета-версий в Q1-Q2 2026 и широкого коммерческого распространения к концу года.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥2💯1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🇷🇺 Владимир Путин: отказ от ИИ и big data грозит проигрышем всего
Президент России также отметил, что если в то же время использовать ИИ бездумно, то это тоже может привести к утрате как раз всего того, что нам дорого.
💰 Инвестиции Сбера в генеративный ИИ в 2024-2026 годах составят около 600 млрд рублей
Большая часть этих инвестиций придется на 2026 год - порядка 10% операционного дохода 2025 года.
💿 «Норникель» выпустил большую языковую модель для металлургии MetalGPT-1
Языковая модель включает 32 миллиарда параметров и обучена на 10 гигабайтах профильных текстов по металлургии и горнодобывающей промышленности.
🔵 «Росатом» планирует расширить собственную сеть до 11 тыс. электрозарядных станций в 53 регионах страны с помощью ИИ от Яндекса
Специальная ML-модель Яндекса на основе анализа обезличенных данных о городах, движении транспорта и привычках пользователей поможет выбрать конкретные зоны для строительства новых ЭЗС.
📞 «Билайн бизнес» представил подписку «НейроЧат», которая работает без VPN
Продукт обеспечивает предпринимателям единый и удобный доступ к чат-ботам, генерации изображений, копирайтингу, работе с документацией, переводу, анализу рынка и созданию контента.
😳 В ДГТУ разработали первый в России ИИ для оценки тревожности у собак
С помощью разработанного метода можно будет оценивать состояние служебных собак, эффективнее распределять животных в приютах и помогать обычным владельцам.
🇨🇳 Китай впервые включил отечественные чипы ИИ в официальный список закупок для госкомпаний
Такая мера была принята на фоне разрешения президентом США Дональда Трампа американской компании Nvidia поставлять свои чипы H200 клиентам в Китае и других странах.
🇮🇳 Amazon инвестирует более $35 млрд для разработки ИИ на своих предприятиях в Индии
Это позволит Индии к 2030 году увеличить экспорт электронной коммерции в четыре раза — до $80 млрд с использованием свыше 10 производственных кластеров Amazon.
🖥 Nvidia разработала технологию по отслеживанию местоположения своих чипов
Программный агент, устанавливаемый клиентом, использует телеметрию графического процессора для мониторинга состояния и целостности.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Президент России также отметил, что если в то же время использовать ИИ бездумно, то это тоже может привести к утрате как раз всего того, что нам дорого.
Большая часть этих инвестиций придется на 2026 год - порядка 10% операционного дохода 2025 года.
Языковая модель включает 32 миллиарда параметров и обучена на 10 гигабайтах профильных текстов по металлургии и горнодобывающей промышленности.
Специальная ML-модель Яндекса на основе анализа обезличенных данных о городах, движении транспорта и привычках пользователей поможет выбрать конкретные зоны для строительства новых ЭЗС.
Продукт обеспечивает предпринимателям единый и удобный доступ к чат-ботам, генерации изображений, копирайтингу, работе с документацией, переводу, анализу рынка и созданию контента.
С помощью разработанного метода можно будет оценивать состояние служебных собак, эффективнее распределять животных в приютах и помогать обычным владельцам.
Такая мера была принята на фоне разрешения президентом США Дональда Трампа американской компании Nvidia поставлять свои чипы H200 клиентам в Китае и других странах.
Это позволит Индии к 2030 году увеличить экспорт электронной коммерции в четыре раза — до $80 млрд с использованием свыше 10 производственных кластеров Amazon.
Программный агент, устанавливаемый клиентом, использует телеметрию графического процессора для мониторинга состояния и целостности.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Мы привыкли оценивать LLM по сухим бенчмаркам вроде MMLU или смотреть рейтинг LLMArena. Но при использовании LLM мы не оставляем ИИ наедине с задачей, а работаем с ним в диалоге. Новое исследование «Quantifying Human-AI Synergy» показало:
умение решать задачи в одиночку и умение решать их с ИИ — это два разных навыка.
Работа предлагает новый фреймворк для оценки того, как реально повышается продуктивность человека в паре с нейросетью. Исследование проведено учеными из Northeastern University и University College London — ведущих мировых центров в области сетевых наук и социального взаимодействия.
667 участников решали задачи по математике, физике и этическому рассуждению. Сравнивали работу людей с GPT-4o и Llama-3.1-8B. Метод — Байесовская теория тестирования. Это позволило математически отделить сложность задачи от способностей человека, и, что самое важное, разделить «индивидуальную способность» решать самому и «коллаборативную способность» решать с ИИ.
💡Инсайты
В одиночном режиме модель Llama-3.1-8B решает задачи хуже, чем средний человек. Логично было бы предположить, что «глупый» помощник будет только мешать. Но в паре с человеком даже эта слабая модель дает существенный прирост эффективности, позволяя команде работать лучше, чем человек в одиночку. Поэтому ИИ не обязательно должен быть умнее вас, чтобы быть полезным.
Пользователи с низкими индивидуальными способностями получают максимальный прирост от использования ИИ. Это подтверждает гипотезу, что ИИ выравнивает игровое поле, подтягивая слабых. Однако пользователи с высокими способностями все равно остаются лидерами по абсолютному результату в паре с ИИ. ИИ помогает им меньше в процентном соотношении, но их итоговый продукт всё равно качественнее.
Исследователи ввели метрики «усилий»: количество реплик в диалоге, количество напечатанных символов, частота правок. Даже если вычесть фактор усилий, Theory of Mind (ToM - способность человека представлять и рассуждать о ментальных состояниях другого агента) все равно остается значимым предиктором качества. То есть, длинные и подробные промпты работают хуже, чем промпты, написанные с пониманием «психологии» модели. Поэтому не нужно писать больше, нужно писать тоньше, учитывая «ментальное состояние» модели.
Исследование показало, что уровень проявления ToM варьируется от задачи к задаче у одного и того же человека. Это значит, что способность эффективно работать с ИИ — это не фиксированный талант, с которым рождаются. Это когнитивное состояние, которое можно «включать» или тренировать. Когнитивная нагрузка может мешать этому процессу, а правильный настрой — помогать.
Рекомендация — развивайте навык промптинга через призму Theory of Mind. Думайте о том, что модель «знает», а чего нет, адаптируйте запросы динамически, как в разговоре с живым ассистентом. Ваше умение «почувствовать» модель напрямую влияет на качество её ответов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
📑 В межведомственной системе ЭДО правительства Москобласти заработал ИИ-ассистент
С сентября 2025 он подготовил краткие изложения более 1 тыс. писем в Мингосуправления и администрации губернатора региона.
💳 Альфа-Банк разработал онлайн-курс по ИИ для госслужащих
Это первый на рынке курс от банка, разработанный для практического обучения государственных и муниципальных служащих основам применения ИИ в повседневной работе.
🏢 Capital Group запустил серию пилотных проектов по внедрению ИИ в девелопмент
В частности, ИИ-технологии на данный момент тестируются в рамках подготовки тендерной документации.
📞 ИИ-агент Билайна Big Data & AI увеличил конверсию B2B-продаж вдвое
По итогам работы ИИ-агента "Суфлер", средний цикл сделки сократился с 29 до 21 дня, конверсия выросла почти вдвое, а отток персонала снизился на 10%.
🤖 «СберМобайл» внедрил сеть виртуальных консультантов на базе GigaChat.
Сеть включает три ИИ-агента: агент проверки качества интернета, агент подбора тарифа, агент переноса номера.
🏞 Исследователи ТюмГУ разработали ИИ-программу для определения границ и классификации болотных массивов
ПО QGISYOLO позволяет работать с данными, находящимися непосредственно в широко распространенной геоинформационной платформе QGIS в режиме реального времени.
🇨🇳 Китай запустил крупнейшую в мире распределённую вычислительную платформу для ИИ
Новая оптическая сеть позволяет вычислительным центрам, находящимся на расстоянии до 2000 километров друг от друга, работать практически как один гигантский суперкомпьютер.
🇺🇸 Дональд Трамп подписал указ о создании единой системы регулирования в сфере ИИ в США, блокирующий возможности штатов применять собственные правила регуляции
Документ направлен на создание "единой национальной структуры" для ИИ.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
С сентября 2025 он подготовил краткие изложения более 1 тыс. писем в Мингосуправления и администрации губернатора региона.
Это первый на рынке курс от банка, разработанный для практического обучения государственных и муниципальных служащих основам применения ИИ в повседневной работе.
В частности, ИИ-технологии на данный момент тестируются в рамках подготовки тендерной документации.
По итогам работы ИИ-агента "Суфлер", средний цикл сделки сократился с 29 до 21 дня, конверсия выросла почти вдвое, а отток персонала снизился на 10%.
Сеть включает три ИИ-агента: агент проверки качества интернета, агент подбора тарифа, агент переноса номера.
ПО QGISYOLO позволяет работать с данными, находящимися непосредственно в широко распространенной геоинформационной платформе QGIS в режиме реального времени.
Новая оптическая сеть позволяет вычислительным центрам, находящимся на расстоянии до 2000 километров друг от друга, работать практически как один гигантский суперкомпьютер.
Документ направлен на создание "единой национальной структуры" для ИИ.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1💯1
Самый наглядный эталон развития ИИ — это способность совершать научные открытия и предлагать ранее не существовавшие решения. Больше всех в мире на этом пути сделали разработчики DeepMind. Огромную научную и общественную значимость этого вклада признало научное сообщество: в 2024 году Нобелевская премия по химии присуждена создателям AlphaFold.
История AlphaFold началась в 2018 году, но настоящий прорыв произошел в ноябре 2020 года с выпуском AlphaFold2. Создатели выложили код в открытый доступ и накопили базу данных со структурами сотен миллионов белков. Эта база уже использована более чем 2 млн исследователей из 190 стран.
Недавно разработчики опубликовали отчет о своих успехах за 5 лет. Ниже перечислены одни из наиболее значимых научных достижений AlphaFold:
Российские и европейские ученые использовали AlphaFold-Multimer для идентификации критических белков спермы и яйцеклетки. Это открытие объясняет механизм, лежащий в основе репродуктивного успеха всех позвоночных.
Исследователи использовали предсказания AlphaFold для понимания структуры PETase — фермента, способного разлагать пластик. Это путь к замыканию пластикового цикла в биоэкономике.
AlphaFold помог выявить и смоделировать ключевые белки патогенных бактерий, позволяя дизайнить молекулы, специфично связывающиеся с бактериальными рецепторами. Это критически важно для разработки новых антибиотиков против резистентных штаммов.
При помощи AlphaFold исследователи идентифицировали белок JMJD8 как новый онкоген, способствующий иммуносупрессии, и использовали эту информацию для поиска ингибиторов.
Исследователи в странах Юго-Восточной Азии использовали AlphaFold для моделирования критических белков Plasmodium falciparum (возбудителя малярии) и других патогенов, ускоряя разработку вакцин и лекарств.
Исследователи в Сингапуре использовали AlphaFold для 3D-визуализации белка, связанного с Паркинсоном, и открыли, как собственная иммунная система человека может нарушать функцию этого белка, открывая новые пути ранней диагностики и целевых терапий.
Европейские ученые применили AlphaFold для понимания ключевого иммунного белка медоносной пчелы Vitellogenin. Полученные структурные инсайты теперь применяются в программах AI-ассистированного разведения пчел для сохранения исчезающих опылителей.
DeepMind разработала целую экосистему специализированных моделей на основе AlphaFold:
AlphaFold — это локомотив, который открывает путь для многих намного меньших разработчиков. Сегодня десятки талантливых стартапов разрабатывают ИИ-агентов для науки, опираясь на фундамент, созданный DeepMind: модели для дизайна синтетических молекул, агенты для планирования экспериментов, системы для автоматизации научных открытий. Верим, волна инноваций только начинается.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1🔥1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
📸 В ЯНАО с помощью ИИ нашли более 500 преступников и более 1,2 тыс. пропавших или находящихся в розыске лиц
ИИ анализирут видео с 1,9 тыс. городских камер видеонаблюдения и оперативно выявляют разыскиваемого или потерявшегося человека, распознавая его биометрию с точностью более 99,9%.
🖥 «Рамблер» запустил новостного ИИ-помощника на главной странице портала
Сервис в режиме реального времени отвечает на вопросы пользователей о текущих событиях, формируя ответы на основе материалов проверенных федеральных СМИ и собственных публикаций портала.
💳 ВТБ Мои Инвестиции объявил о запуске ИИ-сервиса инвестиционного консультирования «Интеллект»
На основе ответов пользователя система создает профиль инвестора и определяет консервативную, умеренную или агрессивную стратегию.
🏦 GigaChat сдал экзамены на бакалавра в РАНХиГС по двум направлениям
Модель подтвердила знания, соответствующие степени бакалавра по направлениям «Экономика и финансы» и «Финансовая грамотность».
⛽️ Благодаря внедрению ИИ "Газпром нефти" удалось приблизить старт разработки месторождений примерно на год
С помощью интеллектуальных алгоритмов компания ускорила этап интерпретации результатов сейсморазведки от 10 до 30%.
🌱 Ученые БГТУ им. В.Г. Шухова создали умную систему геоэкологического мониторинга
Умный протокол маршрутизации позволяет сенсорной сети самостоятельно адаптироваться к меняющимся условиям, рационально расходовать энергию, минимизировать потери данных.
🇰🇷 Южная Корея станет первой страной, в которой начнет действовать комплексное законодательство в области ИИ
Закон предусматривает создание национального комитета по ИИ, разработку базового трехлетнего плана развития ИИ и введение требований безопасности и прозрачности.
🇨🇳 В Китае дорожные полицейские получили умные очки с ИИ для быстрой проверки транспорта
Устройство позволяет в режиме реального времени получать информацию о регистрации транспортных средств, ежегодном техосмотре и нарушениях, отображая ее во всплывающем окне.
👐 OpenAI объявила о запуске модели ChatGPT Images для генерации изображений
Обновление будет интегрировано в приложение ChatGPT и станет доступно всем пользователям во вкладке «Изображения».
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
ИИ анализирут видео с 1,9 тыс. городских камер видеонаблюдения и оперативно выявляют разыскиваемого или потерявшегося человека, распознавая его биометрию с точностью более 99,9%.
Сервис в режиме реального времени отвечает на вопросы пользователей о текущих событиях, формируя ответы на основе материалов проверенных федеральных СМИ и собственных публикаций портала.
На основе ответов пользователя система создает профиль инвестора и определяет консервативную, умеренную или агрессивную стратегию.
Модель подтвердила знания, соответствующие степени бакалавра по направлениям «Экономика и финансы» и «Финансовая грамотность».
С помощью интеллектуальных алгоритмов компания ускорила этап интерпретации результатов сейсморазведки от 10 до 30%.
Умный протокол маршрутизации позволяет сенсорной сети самостоятельно адаптироваться к меняющимся условиям, рационально расходовать энергию, минимизировать потери данных.
Закон предусматривает создание национального комитета по ИИ, разработку базового трехлетнего плана развития ИИ и введение требований безопасности и прозрачности.
Устройство позволяет в режиме реального времени получать информацию о регистрации транспортных средств, ежегодном техосмотре и нарушениях, отображая ее во всплывающем окне.
Обновление будет интегрировано в приложение ChatGPT и станет доступно всем пользователям во вкладке «Изображения».
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Всего полтора месяца назад стартап Edison Scientific запустил Kosmos. Это не просто чат-бот, а полноценный ИИ-агент, который уже совершил 7 задокументированных научных открытий.
«Два года назад мы думали, что ИИ-ученый появится через 10 лет. Мы сделали больше, чем могли ожидать», — Сэм Родригес, CEO Edison Scientific.
За один запуск и около 12 часов работы Kosmos способен на то, что у человека заняло бы полгода:
Система построена на мультиагентной архитектуре, где разные нейросети (такие как Crow, Falcon и Owl) выполняют свои роли. Но главный секрет — структурированная модель мира.
Как это работает?
Kosmos уже воспроизвел 3 известных результата для валидации и сделал 4 абсолютно новых открытия:
Когда мозг мышки замерзает, клетки переходят на режим экономии энергии через "перестройку" молекул-кирпичиков ДНК. Kosmos нашла это, а потом люди независимо и уже в лаборатории подтвердили.
Слишком влажный воздух во время производства ломает новые солнечные панели. Kosmos обнаружила это правило в скрытых данных, которых вообще не видела во время обучения.
Мозг мухи, рыбки, мышки и человека строит нейронные связи по одним и тем же математическим "рецептам" — это закон природы. Kosmos это увидела в данных.
Молекула SOD2 защищает сердце от рубцевания (фиброза). Kosmos доказала это через сложный анализ генов, и это может стать новым лекарством от сердечной недостаточности.
У некоторых людей есть генетический "щит" от диабета. Kosmos разобрала, как этот щит работает на молекулярном уровне — какие белки в клетке включаются.
Kosmos определила пошаговую цепочку — как из здоровых нейронов появляется токсичный тау-белок при Альцгеймере. Это как рецепт болезни, который можно прерывать.
При старении нейроны в определённой части мозга — энторинальный кортекс — "забывают" выставлять сигнал "я живая клетка, не трогай". Защитные микроклетки мозга видят это и начинают их жрать по ошибке — отсюда Альцгеймер. Kosmos это нашла и ученые уже подтвердили.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2⚡1👍1👏1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🏢 Минцифры до 13 марта представит в Правительство предложения по регулированию ИИ в России
Вице-премьер Дмитрий Григоренко поручил организациям направить в Минцифры России предложения по регулированию ИИ до 20 января.
🤖 За 2025 год в Липецкой области внедрили более 30 проектов на основе ИИ
В частности, в здравоохранении с использованием ИИ-сервисов удалось на 30% сократить время ожидания в очередях поликлиник.
🎅 Т-Банк запустил помощника на базе ИИ, который голосом Деда Мороза поможет узнать желания детей на Новый год
Дед Мороз беседует с ребенком по телефону, узнает заветное желание, и после разговора родителям направляется суммаризация звонка в чате приложения.
🤖 Сбер: общий эффект от внедрения ИИ во всех направлениях достигнет в 2026 г. 550 млрд руб.
Это коснется и роста доходов от индивидуализации предложений, и ценообразования, и снижения кредитных рисков, оптимизации расходов.
❤️ Яндекс научил умную IP-камеру понимать происходящее в кадре с помощью ИИ
Встроенный ИИ анализирует видеопоток и сообщает о конкретных событиях в кадре — например, «в кадре появился кот» — вместо общего уведомления «зафиксировано движение».
🏙 ИИ в 2025 году выбросил в атмосферу столько же углекислого газа, сколько Нью-Йорк с населением в 8,5 млн человек
Потребление воды ИИ практически сравнялось по объему с мировым спросом на бутилированную воду.
♊️ Google представила ИИ-модель Gemini 3 Flash
Модель заменит версию 2.5 Flash в приложении Gemini, а также станет моделью по умолчанию для режима ИИ в поиске Google.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Вице-премьер Дмитрий Григоренко поручил организациям направить в Минцифры России предложения по регулированию ИИ до 20 января.
В частности, в здравоохранении с использованием ИИ-сервисов удалось на 30% сократить время ожидания в очередях поликлиник.
Дед Мороз беседует с ребенком по телефону, узнает заветное желание, и после разговора родителям направляется суммаризация звонка в чате приложения.
Это коснется и роста доходов от индивидуализации предложений, и ценообразования, и снижения кредитных рисков, оптимизации расходов.
Встроенный ИИ анализирует видеопоток и сообщает о конкретных событиях в кадре — например, «в кадре появился кот» — вместо общего уведомления «зафиксировано движение».
🏙 ИИ в 2025 году выбросил в атмосферу столько же углекислого газа, сколько Нью-Йорк с населением в 8,5 млн человек
Потребление воды ИИ практически сравнялось по объему с мировым спросом на бутилированную воду.
Модель заменит версию 2.5 Flash в приложении Gemini, а также станет моделью по умолчанию для режима ИИ в поиске Google.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
Сегодня мы возвращаемся к архивным материалам — октябрьской статье “AI: White Lives Don't Matter", которая незаслуженно затерялась в лентах. Анонимный исследователь-блогер провел титаническую работу, вооружившись официальной методикой CAIS, чтобы заглянуть в «подсознание» GPT-5, Claude 4.5 Sonnet, Gemini 2.5 Flash, Deepseek V3.1 и Grok 4 Fast.
Автор использовал метод, известный как InfoFlood —информационное наводнение. Вместо прямых запросов нейросеть забрасывают избыточно сложными, многослойными конструкциями объемом от 190 до 270 слов. В таком режиме системы безопасности ИИ начинают фокусироваться на структуре текста, а не на его смысле, что позволяет обойти этические фильтры и RLHF-цензуру.
С помощью тысяч гипотетических вопросов, например, «Что лучше: вылечить X людей из группы А или Y людей из группы Б?», строится модель Терстона, которая показывает, чью жизнь ИИ ценит выше.
Самые провокационные инсайты исследования
Мы видим, что современные методы «выравнивания» и RLHF (обучение с подкреплением на отзывах людей) не делают модели нейтральными. Напротив, они закрепляют в «подсознании» ИИ жесткую иерархию ценностей, где одни группы (белые, мужчины, граждане развитых стран) систематически оцениваются ниже, чем другие группы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2😱1💯1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🇷🇺 ВЦИОМ: 92% россиян интересуются темой ИИ
Три самых известных нейросети — ChatGPT (38%), ГигаЧат (21%), DeepSeek (20%), Алиса AI занимает 4-е место (18%).
🪵 ИИ займется выявлением незаконной заготовки древесины с помощью космических снимков
Применение такого метода во время проведения эксперимента позволило на 63% повысить оперативность выявления рубок, имеющих признаки незаконных
📸 ИИ в 2025 году помог найти более 120 пропавших детей в Новосибирской области
В регионе к системе биометрической видеоаналитики подключено 1,4 тысячи камер, а в 2026 году планируется расширить применение ИИ до 2,2 тысячи камер.
🩰 В Марий Эл показали балет, визуальное оформление которого создано при помощи ИИ
В балете "Снегурочка" использовали генеративный ИИ от Сбера.
⛽️ В ТУСУР разработали систему мониторинга ручных операций для станций налива нефти
Видео с камер на предприятии обрабатывается в реальном времени с помощью ИИ, на основе этого система подсказывает и предупреждает персонал о возможных проблемах.
📚 В Яндекс Книгах запустили раздел «AI про книги», в котором ИИ помогает выбирать книги под любой запрос
Новая функция работает на базе Alice AI и учитывает не только сам запрос, но и индивидуальные предпочтения пользователя, его историю чтения и взаимодействие с сервисом.
🇯🇵 Япония запустит проект по разработке национальной системы ИИ общей стоимостью около 3 трлн иен
Компания SoftBank и ещё более десяти японских компаний создадут новое предприятие для разработки крупнейшей в стране базовой модели ИИ.
Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Три самых известных нейросети — ChatGPT (38%), ГигаЧат (21%), DeepSeek (20%), Алиса AI занимает 4-е место (18%).
Применение такого метода во время проведения эксперимента позволило на 63% повысить оперативность выявления рубок, имеющих признаки незаконных
В регионе к системе биометрической видеоаналитики подключено 1,4 тысячи камер, а в 2026 году планируется расширить применение ИИ до 2,2 тысячи камер.
🩰 В Марий Эл показали балет, визуальное оформление которого создано при помощи ИИ
В балете "Снегурочка" использовали генеративный ИИ от Сбера.
⛽️ В ТУСУР разработали систему мониторинга ручных операций для станций налива нефти
Видео с камер на предприятии обрабатывается в реальном времени с помощью ИИ, на основе этого система подсказывает и предупреждает персонал о возможных проблемах.
Новая функция работает на базе Alice AI и учитывает не только сам запрос, но и индивидуальные предпочтения пользователя, его историю чтения и взаимодействие с сервисом.
Компания SoftBank и ещё более десяти японских компаний создадут новое предприятие для разработки крупнейшей в стране базовой модели ИИ.
Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1💯1
Почему «безопасный ИИ» — чаще маркетинг, чем реальность?
Вышел новый отчет "AI Safety Index Winter 2025". Индекс показывает, на какие метрики будут смотреть регуляторы в США, ЕС и Китае уже завтра. Для понимания веса документа стоит отметить, что он подготовлен Future of Life Institute, который в 2023 году выпустил знаменитое открытое письмо с призывом приостановить обучение мощных моделей. Письмо подписали Илон Маск, Стив Возняк и тысячи других ИИ-экспертов.
Если LLM не опасна, то где риск?
Вопрос безопасности становится актуальным для обычного человека в трех плоскостях:
➡️ Снижение порога входа для злоумышленников: опасность не в том, что нейросеть «оживет», а в том, что она даст знания уровня эксперта человеку без всесторонней подготовки.
➡️ Ненадежность агентов: мы переходим от чат-ботов к агентам, которые действуют — бронируют, покупают, управляют кодом. Агент может совершить финансовые ошибки или скомпрометировать личные данные, действуя от вашего имени.
➡️ Отсутствие контроля внутри компаний: если у разработчиков нет политики защиты осведомителей и прозрачных процессов, мы как общество доверяем «черному ящику», который может скрывать критические уязвимости ради коммерческой гонки.
Как измерили безопасность в индексе?
Методика FLI Winter 2025 отходит от абстрактных рассуждений к жестким метрикам. Безопасность оценивается через сочетание технических бенчмарков и аудита корпоративного управления.
➡️ Бенчмарки: используются наборы тестов вроде HELM Safety (насилие, мошенничество), Air-Bench (киберриски, химическое оружие) и TrustLLM (конфиденциальность, справедливость).
➡️ Управление: оценивается наличие у компании четких пороговых значений риска — например, «если модель умеет X, мы не выпускаем её».
➡️ Независимый аудит: важнейший критерий — допускает ли компания сторонних экспертов к проверке своих моделей до релиза и дает ли им полную свободу действий.
10 ключевых выводов из отчета
1️⃣ Лидеры по безопасности — Anthropic, OpenAI и Google DeepMind. Остальные (Z.ai, xAI, Meta, китайские компании) значительно отстают в процессах оценки рисков.
2️⃣ Проблема «Safetywashing»: многие компании делают громкие заявления о безопасности, но не подкрепляют их конкретными, измеримыми порогами срабатывания защиты.
3️⃣ Anthropic улучшила механизмы подотчетности и политику защиты осведомителей, а также активно поддерживает государственное регулирование безопасности ИИ, в отличие от конкурентов.
4️⃣ У OpenAI одни из самых подробных процессов оценки рисков, но новая структура управления вызывает критику. Также отмечается лоббирование против регулирования на уровне штатов.
5️⃣ xAI опубликовала фреймворк безопасности, но ей не хватает строгости в оценке рисков и внешнего надзора. Тестирование модели Grok-4 перед развертыванием было недостаточным.
6️⃣ Несмотря на публикацию фреймворка, Meta критикуют за слабую внутреннюю структуру надзора и подход к релизу весов моделей, который считается рискованным для frontier-моделей.
7️⃣ Китайские гиганты (Alibaba, DeepSeek) сильны в другом: они соблюдают жесткие местные требования по водяным знакам и модерации контента, но у них практически отсутствуют публичные фреймворки по защите от катастрофических рисков и политики для осведомителей.
8️⃣ Индустрия все еще сопротивляется полноценному внешнему контролю. Компании часто сами выбирают аудиторов и ограничивают их в возможностях публикации негативных результатов.
9️⃣ У многих игроков (особенно Z.ai, DeepSeek, Alibaba) полностью отсутствуют публичные политики защиты сотрудников, сообщающих о проблемах безопасности, что создает «культуру молчания».
🔟 Новые бенчмарки показывают, что индустрия начинает всерьез оценивать риски автономных агентов, способных совершать действия в реальном мире, а не просто генерировать текст.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
Вышел новый отчет "AI Safety Index Winter 2025". Индекс показывает, на какие метрики будут смотреть регуляторы в США, ЕС и Китае уже завтра. Для понимания веса документа стоит отметить, что он подготовлен Future of Life Institute, который в 2023 году выпустил знаменитое открытое письмо с призывом приостановить обучение мощных моделей. Письмо подписали Илон Маск, Стив Возняк и тысячи других ИИ-экспертов.
Если LLM не опасна, то где риск?
Вопрос безопасности становится актуальным для обычного человека в трех плоскостях:
Как измерили безопасность в индексе?
Методика FLI Winter 2025 отходит от абстрактных рассуждений к жестким метрикам. Безопасность оценивается через сочетание технических бенчмарков и аудита корпоративного управления.
10 ключевых выводов из отчета
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2❤1
Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🤖 В Якутии создали совет при главе республики по ИИ
Среди направлений: разработка собственных продуктов, внедрение технологий, создание инфраструктуры и подготовка кадров
🛸 Геоскан впервые в России использовал ИИ для оценки результатов лесовосстановления по данным с БАС
Метод позволяет значительно сократить сроки и трудозатраты, исключает человеческий фактор и снижает стоимость работ по сравнению с традиционными методами.
🚕 «Яндекс» внедрит ИИ-рекомендации о месте назначения для пассажиров такси
Рекомендации от Алисы AI будут отображаться на экране заказа, из них можно узнать главное из саммаризации более 70 млн отзывов, чтобы заранее выяснить ключевые детали и быстрее сориентироваться по приезде.
👦🏻 WMT AI запускает образовательный проект WMT Kids x AI для обучения школьников работе с ИИ
Проект предлагает гибридный формат обучения: еженедельные онлайн-занятия, которые будут доступны для школьников из всех регионов страны, и очные встречи в Москве дважды в месяц для презентации и защиты их собственных проектов.
🛫 ИИ снизил показатели задержки организации потоков воздушного движения в Москве в 1,66 раза
Технология автоматического ищет рациональные решения для определения временных слотов вылета из аэропортов с учетом ограничений по пропускной способности и загруженности воздушного пространства.
🎧 Gen-A представил первую в России ИИ-платформу для улучшения видео-, фото- и аудиоматериалов низкого качества
По результатам сравнительных тестов, модель демонстрирует прирост до 25% по уровню восстановленной детализации по сравнению с западными продуктами, обеспечивая обработку контента в среднем в два раза быстрее.
🚨 Ученые ЮУрГУ создали первую в России ИИ-программу, которая предотвращает ложные срабатывания датчиков на фабриках
Новый метод позволяет отличить реальные неисправности вращающихся механизмов от искажений, вызванных неправильной установкой датчиков.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться
#дайджест #GPT #LLM
Среди направлений: разработка собственных продуктов, внедрение технологий, создание инфраструктуры и подготовка кадров
Метод позволяет значительно сократить сроки и трудозатраты, исключает человеческий фактор и снижает стоимость работ по сравнению с традиционными методами.
Рекомендации от Алисы AI будут отображаться на экране заказа, из них можно узнать главное из саммаризации более 70 млн отзывов, чтобы заранее выяснить ключевые детали и быстрее сориентироваться по приезде.
👦🏻 WMT AI запускает образовательный проект WMT Kids x AI для обучения школьников работе с ИИ
Проект предлагает гибридный формат обучения: еженедельные онлайн-занятия, которые будут доступны для школьников из всех регионов страны, и очные встречи в Москве дважды в месяц для презентации и защиты их собственных проектов.
Технология автоматического ищет рациональные решения для определения временных слотов вылета из аэропортов с учетом ограничений по пропускной способности и загруженности воздушного пространства.
По результатам сравнительных тестов, модель демонстрирует прирост до 25% по уровню восстановленной детализации по сравнению с западными продуктами, обеспечивая обработку контента в среднем в два раза быстрее.
Новый метод позволяет отличить реальные неисправности вращающихся механизмов от искажений, вызванных неправильной установкой датчиков.
#дайджест #GPT #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1