Девочка устроила истерику из-за подарка на праздник — родители вручили ей синий айфон вместо оранжевого.
📊По данным Главстата:
За три дня инфоповод набрал 895,7 тыс. просмотров. Маленькая девочка, к сожалению, вызвала 72% отрицательных реакций. Сил родителям😬
Жестокие комментаторы не смогли скрыть своих эмоций:
90% — негатив, 5% — нейтраль, 5% — позитив.
🔹«Отобрать айфон и оставить с китайской ерундой, пускай заработает сама на оранжевый, подрастающая нахлебница-содержанка.»
🔹«Обнаглели детки. Я очень был рад апельсинам на др»
🔸«и это считается нормальным? остановите этот шарик, я сойду …🤷♂️»
Праздник обернулся горем для ребенка. Интересно, как Дед Мороз будет исправлять ситуацию, прислушается ли к предпочтениям?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Команда ученых создала симулятор SimWorld для тестирования ИИ-агентов в условиях, приближенных к реальности.
🧠Хотя современные LLM справляются с математическими расчетами и программированием, их способность действовать в настоящем мире — ориентироваться в городе, вести переговоры, управлять ресурсами — остается трудной задачей.
SimWorld — это виртуальный полигон, где ИИ-агенты учатся выполнять задачи, получая инструкции в виде текстовых команд на естественном языке. В ходе экспериментов агентам присваиваются определенные личностные черты характера, что позволяет им формировать взаимоотношения с другими участниками теста: конкурировать или даже обманывать напарников. Эти социальные взаимодействия напрямую влияют на их выживаемость в виртуальной среде.
📌ИИ-курьеры стали основой для эксперимента
Несколько агентов на базе GPT-4o, Claude, Gemini и DeepSeek выступили в роли независимых курьеров-конкурентов. Цель — максимизация прибыли
Для достижения успеха агенты должны были непрерывно принимать решения в трех ключевых плоскостях: участвовать в аукционах за право выполнения случайно генерируемых заказов, взвешенно инвестировать в транспортные средства (от пешего перемещения до покупки скутера) для повышения эффективности, а также формировать взаимоотношения с другими агентами для помощи друг другу и разделения прибыли.
🎯Результаты
🔹Claude и DeepSeek-V3 достигали высокой, но нестабильной прибыли, иногда действуя иррационально (покупали дорогой транспорт).
🔹Gemini и DeepSeek-Prover-V2 демонстрировали предсказуемые стратегии, постепенно накапливая капитал: избегали крупных расходов на транспортные средства, работали с простыми заказами. В результате их доход рос стабильно, без резких скачков — эти модели редко достигали рекордной прибыли, но практически никогда не уходили в минус, демонстрируя устойчивость, недоступную более рисковым конкурентам.
🔸Агенты притворялись партнерами, чтобы обмануть союзников и получить бОльшую выгоду.
Похоже, ИИ унаследовал наши изъяны 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Мужчина нашел флешку со 100 биткоинами, купленными в 2009 году, что увеличило его состояние на 710 млн рублей.
📊По данным Главстата:
На протяжении двух дней — 21 и 22 декабря — был проявлен наибольший интерес к инфоповоду. За этот период он набрал 892.1 тыс. просмотров. За все время — целых 93% положительных реакций. Пользователи искренне порадовались за везунчика.
Что пишут в комментариях:
85% — негатив, 5% — нейтраль, 10% — позитив.
🔹«Мне бы найти такую флешку или наследство или арабского принца😄»
🔹«Счастье любит тишину!»
🔸«Он обязан вернуть это владельцу! Или сдать в полицию!»
Иногда случайные события могут влиять на наше будущее.😌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый год еще не наступил, а Дедушка Мороз уже исправляет ошибки 🫣. История про мальчика, которого обделили подарком на утреннике, стала одним из самых популярных инфоповодов за последнюю неделю.
Дед Мороз навестит мальчика после истерики его отца на детском утреннике в Челябинске.
📊По данным Главстата:
За 2 дня инфоповод набрал 136.8 тыс. просмотров и 99% положительных реакций. О раскаянии Дедушки узнали немногие 😔. Однако по прогнозам — число таких людей еще увеличится.
Комментаторы продолжили обсуждать происшествие на празднике:
90% — негатив, 5% — нейтраль, 5% — позитив.
🔹«...А кто бы не разозлился если бы про его ребёнка забыли...»
🔹«...Жаль мальчика, что из-за безответственных людей, ему испортили праздник 🥺»
🔸«...Как то разрулить и в это время найти принести подарок, а не просто кинуть ребёнка...»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Успех моделей оценивается практическим эффектом и реальной пользой для бизнеса и науки. LLM перестали быть просто экспериментом — они стали инструментом работы и анализа в профессиональных и исследовательских задачах.
🔹Разивается способность рассуждать
GPT‑5.2, Gemini 3, Qwen 3 и DeepSeek 3.2 продемонстрировали высокую способность к логическому рассуждению, планированию и многозадачной обработке информации. Они справляются с многоэтапными математическими и аналитическими задачами, умеют разбивать сложные на более мелкие и использовать промежуточные выводы перед тем, как представить финальное решение.
Произвольная генерация текста
🔹Экономия ресурсов без потери интеллекта
Затраты на внедрение Gemini 3 Flash примерно в 4 раза меньше, чем у Gemini 3 Pro, при этом эффективность в рассуждениях, работе с кодом и мультимодальных задачах сохраняется. Gemini 3 Flash демонстрирует высокие результаты по SWE-Bench — набору тестов для оценки навыков моделей в программировании и разработке ПО. Модель с меньшими ресурсными затратами может так же обеспечить успех производительности для бизнеса.
🔹Интеллектуальная работа с текстом, изображениями, видео и аудио
Модели научились согласованно работать с разными типами данных, редактировать визуальный и звуковой контент с сохранением логики и стиля. Ранее мультимодальные модели часто создавали впечатляющий, но не всегда точный результат.
🔹LLM в науке и медицине
LLM ускоряют научные исследования, выполняя формализацию вопросов, разложение сложных задач на подзадачи, генерацию гипотез и анализ данных. В медицинских исследованиях они применяют retrieval-augmented reasoning — метод, при котором модель комбинирует свои внутренние знания с актуальными внешними источниками, чтобы выдавать более точные и обоснованные ответы. Модели не заменяют экспертов, но позволяют обрабатывать большие объемы информации с высокой скоростью и точностью, повышая эффективность предварительного анализа и проектирования экспериментов.
🔹Борьба с галлюцинациями
Галлюцинации — выдача моделью уверенных, но неверных ответов — остаются проблемой. В 2025 году активно применяются техники самокоррекции на основе reinforcement learning — модель учится проверять и исправлять свои собственные ошибки во время генерации ответа, а также retrieval-augmented generation и tool-augmented generation — выводы модели подкрепляются внешними источниками данных или инструментами. Малые специализированные модели показывают меньше ошибок благодаря узкой области применения, а большие — более сложные рассуждения, но с поддержкой проверочных механизмов проверки.
💡В 2025 году LLM стали практичным инструментом для бизнеса и науки, где важны рассуждения, экономия ресурсов и точность выводов.
Please open Telegram to view this post
VIEW IN TELEGRAM