Градиент обреченный – Telegram
Выступил на семинаре Института Языкознания (запись будет позже на сайте ИЯ). Аудитория серьезная, записи предыдущих докладов можно посмотреть тут. В прошлый раз, кстати, были интересные рассказы про машинный перевод и цифровизацию башкирского.

Из полезного подготовил пару блокнотов для работы с данными:

Исправление проблем со смешанной кодировкой для обработки текстовых PDF
Извлечение параллельного корпуса при помощи lingtrain-aligner
👍20🔥1271
На HF Daily papers за март было почти 600 статей (!), весна...

В прошлом году автоматизировал для сообщества страничку — hfday.ru, на ней можно посмотреть краткие содержания статей и отфильтровать по категориям, удобно искать какие-то конкретные темы.

Я и сам про эту страничку иногда забываю, но народ, судя по логам, пользуется. Так что напоминаю тем, кто еще не видел и себе тоже.

Парсится и генерится все скриптами, развернуто на процессах GitHub'а, дневные странички обновляются каждые пару часов.

👉 А код тут https://github.com/averkij/top_papers
5🔥28👍851
❤️ Друзья, а ведь нас с вами в канале уже 7000 человек (и немножко кремниевых мешочков). Число немаленькое — раз в 10 больше населения Ватикана и даже больше чем в моем родном поселке.

Всех приветствую! Будем и дальше обсуждать и делать интересные проекты на тему ИИ, изучения языков и программирования.

P.S. Плакат нарисовал в на днях обновившемся Ideogram'е, он стал постабильней работать с генерацией кириллических надписей (и вообще стал сильно круче, попробуйте). В gpt-4o, кстати, также обновилась генерация по тексту, попробуем и его.
Please open Telegram to view this post
VIEW IN TELEGRAM
27👍14🔥10🎉3🤝2
Потестировал вчера Ideogram и gpt-4o и вот что скажу — качество очень прилично подросло за последние несколько месяцев. Если вам в работе и хобби надо делать какие-то прототипы дизайнов и картинок, то надо обязательно использовать (если еще не).

Порисовал обложки для книг. За час получилось несколько десятков веселых обложек. Можно делать так: любой LLM с web-поиском генерируете промпт для генерации картинок (я вбивал в perplexity), что-нибудь типа такого:

"Найди информацию о книге Стругацких "Улитка на склоне". В выводе напиши только промпт для генерации изображения для обложки этой книги. На обложке должна быть яркая сцена из книги, название и имя автора на русском, промпт должен быть на английском. Стиль укиё-э."


Так как есть поиск, то книгу можно задавать любую, которую можно найти в интернете. Полученный промпт уже можно использовать.

gtp-4o работает с русскими надписями гораздо стабильней, хотя тоже ошибается. Самое частое у них — это либо удвоить какую-нибудь букву, либо написать одну вместо удвоенной (либо написать кракозябры). Причем, если просить не писать надписей вообще (чтобы самому дописать в иллюстраторе), то получается как-будто бы похуже. Ideogram делает более разнообразные картинки, быстрей (секунд за 20) и сразу по 4 штуки. Кроме того, на платных подписках там есть редактор с всем типичным функционалом типа inpainting'а, outpainting'а, создания стиля по своим картинкам и т.д. Как специализированный инструмент он кажется получше.

👉 Еще нащупал лайфхак. Если к надписям в полученном промпте добавлять что-то типа "label is in Russian, reads exactly as '...' " и писать не капсом, то процент правильных надписей получается выше.

В общем надо тестить еще и, наверное, накидать пет-проект для end-2-end генерации.
28🔥13👍4🆒2
OpenAI хотят выложить модель в открытый доступ.

Всех с первым апреля!
😁3721👍7🐳3
Ой, какой-то токсичный Monday подъехал в ChatGPT
😁58❤‍🔥84😱3
2😁64🤣8💯7🤔2
А никто не начал использовать Gemini 2.5 Pro для кодинга?

В Cursor'e он уже есть, попробовал его пару дней, работает ощутимо лучше Claude'а. Как-будто меньше кода генерирует и при этом чаще попадает в то, что просишь.
👍28👀82🤔2
Вообще очень классный фидбек, всем спасибо.

Видно, что все люди используют кодовые помощники по разному, есть над чем подумать.
😁29💯43🔥21👍1
Вайб-кодеры vs традиционные разработчики
😁60🔥74👍2
Словил дурацкий баг в Cursor'е — не логинится в IDE после успешного логина в браузере и не дает работать с агентом, переустановка не помогла. Ни у кого не было такого?
😁14👀5👍2🗿1
🔥 На улице снег, на HF — Llama 4

И у них, наконец, появились имена — Behemoth, Maverick, Scout. Последние две уже можно скачивать с HF и официального сайта.

🔸 Все модели теперь MoE (каждый раз активируется только часть от всех весов — "эксперты"). Дальше указаны активное/общее количество параметров.

🔸 Модели мультимодальные и еще более мультиязычные. Претрейн был на более чем 200 языках, из них более ста были с 1B+ токенов. Русский среди поддерживаемых 12-ти языков не указан, видимо, в топ-12 не входит.

🔸 Скаут и Маверик дистиллированы из Бегемота.

Scout → 17B/109B, 16 экспертов. Контекст — 10M токенов❗️. Должна быть умнее всех предыдущих Llama, при этом помещаясь на одну H100 карту.

Maverick → 17B/400B, 128 экспертов. Контекст — 1M токенов. На некоторых тестах показывает уровень GPT-4o. На lmarena.ai вторая после Gemini 2.5 Pro Exp.

Behemoth → 288B/2T❗️, 6 экспертов. Все еще обучается на 32K GPU, по заявлениям разработчиков на некоторых тестах уже превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro. О, да.

👉 llama.com (дают временную ссылку) | HF (одобряют заявку)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1773👍1🎉1