Главкодим потихонечку 🧑‍💻 – Telegram
Главкодим потихонечку 🧑‍💻
99 subscribers
368 photos
2 videos
62 links
💻 Разрабатываем ПО и проводим ИТ-консалтинг
✍️ Дзен https://dzen.ru/glavcode
👋 О нас: https://glavcode.ru/about-us
Download Telegram
😸Пока Филимон пишет письмо Деду Морозу, некоторые пользователи в сети уже успели получить подарки...

Девочка устроила истерику из-за подарка на праздник — родители вручили ей синий айфон вместо оранжевого.


📊По данным Главстата:
За три дня инфоповод набрал 895,7 тыс. просмотров. Маленькая девочка, к сожалению, вызвала 72% отрицательных реакций. Сил родителям😬

Жестокие комментаторы не смогли скрыть своих эмоций:
90% — негатив, 5% — нейтраль, 5% — позитив.
🔹«Отобрать айфон и оставить с китайской ерундой, пускай заработает сама на оранжевый, подрастающая нахлебница-содержанка.»
🔹«Обнаглели детки. Я очень был рад апельсинам на др»
🔸«и это считается нормальным? остановите этот шарик, я сойду …🤷‍♂️»

Праздник обернулся горем для ребенка. Интересно, как Дед Мороз будет исправлять ситуацию, прислушается ли к предпочтениям?

😸Филимон убегает дописывать письмо
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15😁4👏3
😸Филимон на разведке в ИИ-городе: симулятор SimWorld

Команда ученых создала симулятор SimWorld для тестирования ИИ-агентов в условиях, приближенных к реальности.

🧠Хотя современные LLM справляются с математическими расчетами и программированием, их способность действовать в настоящем мире — ориентироваться в городе, вести переговоры, управлять ресурсами — остается трудной задачей.

SimWorld — это виртуальный полигон, где ИИ-агенты учатся выполнять задачи, получая инструкции в виде текстовых команд на естественном языке. В ходе экспериментов агентам присваиваются определенные личностные черты характера, что позволяет им формировать взаимоотношения с другими участниками теста: конкурировать или даже обманывать напарников. Эти социальные взаимодействия напрямую влияют на их выживаемость в виртуальной среде.

📌ИИ-курьеры стали основой для эксперимента
Несколько агентов на базе GPT-4o, Claude, Gemini и DeepSeek выступили в роли независимых курьеров-конкурентов. Цель — максимизация прибыли

Для достижения успеха агенты должны были непрерывно принимать решения в трех ключевых плоскостях: участвовать в аукционах за право выполнения случайно генерируемых заказов, взвешенно инвестировать в транспортные средства (от пешего перемещения до покупки скутера) для повышения эффективности, а также формировать взаимоотношения с другими агентами для помощи друг другу и разделения прибыли.

🎯Результаты
🔹Claude и DeepSeek-V3 достигали высокой, но нестабильной прибыли, иногда действуя иррационально (покупали дорогой транспорт).
🔹Gemini и DeepSeek-Prover-V2 демонстрировали предсказуемые стратегии, постепенно накапливая капитал: избегали крупных расходов на транспортные средства, работали с простыми заказами. В результате их доход рос стабильно, без резких скачков — эти модели редко достигали рекордной прибыли, но практически никогда не уходили в минус, демонстрируя устойчивость, недоступную более рисковым конкурентам.
🔸Агенты притворялись партнерами, чтобы обмануть союзников и получить бОльшую выгоду.

Похоже, ИИ унаследовал наши изъяны 😁

😸Филимон побежал исследовать свой город
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍4😁4😢1
😸Филимон делится историей одного счастливчика

Мужчина нашел флешку со 100 биткоинами, купленными в 2009 году, что увеличило его состояние на 710 млн рублей.


📊По данным Главстата:
На протяжении двух дней — 21 и 22 декабря — был проявлен наибольший интерес к инфоповоду. За этот период он набрал 892.1 тыс. просмотров. За все время — целых 93% положительных реакций. Пользователи искренне порадовались за везунчика.

Что пишут в комментариях:
85% — негатив, 5% — нейтраль, 10% — позитив.
🔹«Мне бы найти такую флешку или наследство или арабского принца😄»
🔹«Счастье любит тишину!»
🔸«Он обязан вернуть это владельцу! Или сдать в полицию!»
Пометка: мужчина изначально является владельцем флешки

Иногда случайные события могут влиять на наше будущее.😌

😸Филимон убегает искать новый инфоповод (или хорошо забытый старый)😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12😎5🔥3
😸Филимон ждет, когда и его навестит Дед Мороз

Новый год еще не наступил, а Дедушка Мороз уже исправляет ошибки 🫣. История про мальчика, которого обделили подарком на утреннике, стала одним из самых популярных инфоповодов за последнюю неделю.

Дед Мороз навестит мальчика после истерики его отца на детском утреннике в Челябинске.


📊По данным Главстата:
За 2 дня инфоповод набрал 136.8 тыс. просмотров и 99% положительных реакций. О раскаянии Дедушки узнали немногие 😔. Однако по прогнозам — число таких людей еще увеличится.

Комментаторы продолжили обсуждать происшествие на празднике:
90% — негатив, 5% — нейтраль, 5% — позитив.
🔹«...А кто бы не разозлился если бы про его ребёнка забыли...»
🔹«...Жаль мальчика, что из-за безответственных людей, ему испортили праздник 🥺»
🔸«...Как то разрулить и в это время найти принести подарок, а не просто кинуть ребёнка...»

😸Филимон думает, что Дедушку Мороза нужно простить. Согласны — ставьте 😸
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
135💯4
😸Филимон подводит итоги 2025 года в мире LLM: как справлялись с работой большие языковые модели, по версии Forbes

Успех моделей оценивается практическим эффектом и реальной пользой для бизнеса и науки. LLM перестали быть просто экспериментом — они стали инструментом работы и анализа в профессиональных и исследовательских задачах.


🔹Разивается способность рассуждать

GPT‑5.2, Gemini 3, Qwen 3 и DeepSeek 3.2 продемонстрировали высокую способность к логическому рассуждению, планированию и многозадачной обработке информации. Они справляются с многоэтапными математическими и аналитическими задачами, умеют разбивать сложные на более мелкие и использовать промежуточные выводы перед тем, как представить финальное решение.

Произвольная генерация текста 🔜Когнитивное мышление

🔹Экономия ресурсов без потери интеллекта

Затраты на внедрение Gemini 3 Flash примерно в 4 раза меньше, чем у Gemini 3 Pro, при этом эффективность в рассуждениях, работе с кодом и мультимодальных задачах сохраняется. Gemini 3 Flash демонстрирует высокие результаты по SWE-Bench — набору тестов для оценки навыков моделей в программировании и разработке ПО. Модель с меньшими ресурсными затратами может так же обеспечить успех производительности для бизнеса.

🔹Интеллектуальная работа с текстом, изображениями, видео и аудио

Модели научились согласованно работать с разными типами данных, редактировать визуальный и звуковой контент с сохранением логики и стиля. Ранее мультимодальные модели часто создавали впечатляющий, но не всегда точный результат.

🔹LLM в науке и медицине

LLM ускоряют научные исследования, выполняя формализацию вопросов, разложение сложных задач на подзадачи, генерацию гипотез и анализ данных. В медицинских исследованиях они применяют retrieval-augmented reasoning — метод, при котором модель комбинирует свои внутренние знания с актуальными внешними источниками, чтобы выдавать более точные и обоснованные ответы. Модели не заменяют экспертов, но позволяют обрабатывать большие объемы информации с высокой скоростью и точностью, повышая эффективность предварительного анализа и проектирования экспериментов.

🔹Борьба с галлюцинациями

Галлюцинации — выдача моделью уверенных, но неверных ответов — остаются проблемой. В 2025 году активно применяются техники самокоррекции на основе reinforcement learning — модель учится проверять и исправлять свои собственные ошибки во время генерации ответа, а также retrieval-augmented generation и tool-augmented generation — выводы модели подкрепляются внешними источниками данных или инструментами. Малые специализированные модели показывают меньше ошибок благодаря узкой области применения, а большие — более сложные рассуждения, но с поддержкой проверочных механизмов проверки.

💡В 2025 году LLM стали практичным инструментом для бизнеса и науки, где важны рассуждения, экономия ресурсов и точность выводов.

😸Филимон убегает докупать подарки
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3🎉3😁2
😸Ждем AGI в 2026. Филимон приготовил удочку
Настало время бороться с галлюцинациями

Сегодня большие языковые модели (LLM) обладают огромным запасом знаний, шаблонов и правил. Они умеют решать сложные задачи, писать тексты, генерировать код. Но, как отмечают авторы статьи The Missing Layer of AGI: From Pattern Alchemy to Coordination Physics, обладание знаниями и вычислительными мощностями само по себе не позволяет модели быть разумной.

🎣Что предлагают авторы?
Идея в том, чтобы ввести координационный уровень, который использует семантическое якорение — внешние опоры, связывающие вывод модели с задачей и ограничениями: примеры, результаты поиска по базе знаний, уточнения целей и проверяемые факты. Небольшой контекст почти не влияет на поведение модели, но после достижения определенного порога система правильно определяет целевой смысл.

Внутри системы координации отдельные компоненты выполняют разные задачи: какие-то генерируют гипотезы, какие-то проверяют их и оценивают аргументы, а память фиксирует промежуточные результаты.

🤔Пора переставать ругать модель?
Локальные ошибки и разногласия корректируются отдельными механизмами в процессе обработки одного запроса, без генерации ответа заново с нуля.

Сложность якорения зависит от того, с чем работает модель: привычные и часто встречающиеся объекты модель понимает легко, а редкие или необычные требуют дополнительных подсказок или промежуточных связей.

🤖LLM — это мощная база знаний, необходимый фундамент. Без дополнительного слоя управления модель иногда выдает точные ответы, а иногда не может решить даже простую задачу.

Настоящий AGI начинается там, где модель умеет использовать следующий токен в генерации не просто как слово в тексте, а как действие, связывая текст с другими типами данных — аудио, видео, сигналами в различных формах.

😁Илон Маск в декабре перенес срок появления AGI на 2026 год. Возможно, дело в том, что мы только начинаем осознавать масштаб недостающих уровней.

😸Филимон снова в рабочем режиме
Please open Telegram to view this post
VIEW IN TELEGRAM
144😁4