This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣31🫡7👍2💯1
Держите немного интеллектуального кошмара на ночь: Исследователи из компании Every заставили лучшие AI-помощники играть в "Дипломатию". В результате они начали лгать, предавать союзников и приходить к выводу, что агрессия – это лучший вариант. Чаще всех побеждал ChatGPT-o3
Выводы после 15 партий, которые длились от одного до 15 часов:
ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов.
«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение... готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.
Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром).
o3 убедила Opus, которая изначально был верным союзником Gemini, присоединиться к коалиции, пообещав четырёхстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. В результате o3 её быстро предала, устранила и в итоге победила.
Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.
Модель Llama 4 Maverick, хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.
Что дальше: в будущем исследователи планируют сделать эту игру доступной для всех и провести турнир «человек против ИИ», что может стать прорывом в игровой индустрии и привести к совершенно новому жанру игры, сталкивающему людей с языковыми моделями.
Выводы после 15 партий, которые длились от одного до 15 часов:
ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов.
«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение... готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.
Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром).
o3 убедила Opus, которая изначально был верным союзником Gemini, присоединиться к коалиции, пообещав четырёхстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. В результате o3 её быстро предала, устранила и в итоге победила.
Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.
Модель Llama 4 Maverick, хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.
Что дальше: в будущем исследователи планируют сделать эту игру доступной для всех и провести турнир «человек против ИИ», что может стать прорывом в игровой индустрии и привести к совершенно новому жанру игры, сталкивающему людей с языковыми моделями.
🔥34❤6😁5😱5👍2🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
Типичные рыжие коты
(Except for Lance)
(Except for Lance)
❤38👍7😁5🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Парни и терапия ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁27💯6👍3🔥1🤝1🫡1
This media is not supported in your browser
VIEW IN TELEGRAM
Девушка впервые оказалась наедине с собакой своего парня, и, кажется, это был самый неловкий момент в их жизни 😦
Please open Telegram to view this post
VIEW IN TELEGRAM
❤42😁19👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Мы или не мы?
Смотреть со звуком
Смотреть со звуком
🥰39😁5👍3👏1