Фемида.Тех – простым языком о технологиях для юристов – Telegram
Фемида.Тех – простым языком о технологиях для юристов
131 subscribers
2 photos
5 links
Про ИИ, базы, поиск и автоматизацию по-человечески.

Архив полезного от @ivorobiev — чтобы было легко найти.
Download Telegram
✈️ ИИ в режиме самолёта: малые модели, большие возможности
Можно платить за каждый токен, но стоит ли?! Малые языковые модели отлично резюмируют текст, ничего не стоят и работают при этом на обычном компьютере. В этом видео мы разберем что это все вообще такое и запустим у себя дома.

[Смотреть]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍2👨‍💻1💘1
📊 Тест: мобильная Gemma 3 не хуже GPT-4 в резюмировании
Показывал в видео Qwen3-30B-A3B и ссылался на исследование. Стало интересно, как новые модели пишут резюме на русском.

Без научных выкрутасов, на коленке:
- Взял 1000 новостей с готовыми резюме (датасет Газета.ру от Ильи Гусева)
- Прогнал через разные модели и сравнил, насколько резюме от моделей похоже на человеческие (метрики Rouge-L и BERTScore, если коротко - “похожесть по смыслу и словам”)

Разницы между гигантскими моделями типа GPT-4 и маленькой Gemma3 (которую можно запускать хоть на телефоне) почти нет! Все показывают практически одинаковый результат — отличия где-то во второй цифре после запятой, на которую бы не смотрел из-за наколенночности теста.

В следующий раз расскажу про современные методы оценки качества и что все эти непонятные слова MMLU и HellaSwag значат 🥲
👍4🔥2
🤔 ИИ на экзамене: сдал или списал?
Как говорится: ты — то, что измеряешь. Половина задачи — понять, как именно это оценить. Сегодня разбираем MMLU, GPQA, DROP и другие методы оценки языковых моделей: что они проверяют и как работают.

[Смотреть]
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3
📊 Занимательные цифры
В тесте MMLU 57% заданий по биологии содержат ошибки, а русский аналог MMLU_RU просто машинный перевод.

Перевод выполнен через API Яндекс.Переводчика. Есть некоторые ошибки перевода, особенно заметные в терминах и формулах, исправления не применялись.


Вот такие пироги — выводы делайте сами!
👍3
🧠 Apple утверждает: ИИ не думает, а лишь имитирует. Так ли это?
В новом видео разбираю:
- Почему рассуждающие модели работают в 30 раз медленнее обычных
- Как фраза "думай пошагово" увеличила точность ИИ с 17% до 79%
- Какие типы мышления освоил ИИ, а какие - нет

👇 Смотрите видео и делитесь мнением - думает ИИ или нет?
🔥102