Поляков считает: AI, код и кейсы – Telegram
Поляков считает: AI, код и кейсы
1.4K subscribers
209 photos
80 videos
141 links
Пишу про AI, вайбкодинг и кейсы применения. Связаться: @polyakovbest
Download Telegram
Неделя в месяц уходит на минус-фразы? Хочу решить это через файн-тюнинг

Почти 20 лет я занимаюсь интернет-рекламой. Последние 10 лет — в основном Яндекс.Директ, автомобили и стройматериалы. Параллельно 10 лет пишу код и все это время пытался автоматизировать самое выматывающее место в Директе — работу с поисковыми фразами.

💡 По моим наблюдениям, сотрудники агентств тратят примерно неделю в месяц на анализ статистик по фразам и модификацию условий показа. Это ~25% рабочего времени на тупую рутину.


Через файн-тюнинг языковых моделей мне удалось это автоматизировать. Модель смотрит на статистику и содержимое запросов, находит мусор и аномалии, и предлагает решение: отключить, переписать условие показа или оставить как есть.

🎯 Что получилось автоматизировать

Начал с минусации — модель научилась распознавать мусорный трафик быстро и адекватно, даже при неполных данных.

Потом понял: управление фразами — это не только минусация.

— Иногда надо менять само условие показа,
— Иногда полностью отключать направление.
— А еще платформа меняется — в 2024 году все помещали ключи в [квадратные скобки], а в 2025 это перестало работать. Модель адаптируется под такие изменения благодаря обучению.

Сейчас работаю над воркфлоу для автотаргетинга — система находит новые перспективные направления и автоматически создает объявления, чтобы потом можно было выключить автоматический подбор фраз. Интерфейс уже раз пять переделывал и еще столько же переделаю 😅

Система работает, но сейчас она обучена на моих проектах. Чтобы сделать её действительно универсальной и мощной — нужны данные от разных агентств и рекламодателей. Много данных.

🔬 Зачем мне партнеры для обучения

Главная фишка — тренировка моделей. Чем больше размеченных данных, тем умнее система. Мой план — собрать данные для большого файн-тюнинга хотя бы на $5000, чтобы создать действительно мощную «монстр-модель» для управления рекламой.

Кого я ищу:

1️⃣ Агентства — у вас есть внутренняя экспертиза и вы можете дать качественную разметку данных

2️⃣ Компании с инхаус-рекламой — думаю экспертиза не отличается от агентсткого уровня

3️⃣ Самостоятельные рекламодатели или фрилансеры — можем обсудить условия сотрудничества

💰 Что я беру на себя

🔸 Оплачиваю файн-тюнинг за свой счет

🔸 Скидка на продукт после запуска — платите только за потраченные токены без наценки

🔸 Приоритетный доступ к новым фичам и возможность влиять на развитие продукта под ваши задачи

Если вы или ваша команда ведете Яндекс.Директ и устали ковыряться в фразах — напишите мне @polyakovbest

Если у вас есть друзья, кто отвечает за контекст в агентстве или компании — просто перешлите им этот пост. Для меня это сейчас важнее любой рекламы.

А еще можете высказать мнение в комментариях по самой идее. Понимаю, что есть и слова против: автостратегии рулят и т д — мне будет интересно подискутировать.

----

Поляков считает — про ИИ, рекламу и аналитику.
2🔥63👍1
Семейная ипотека vs вклад: калькулятор говорит «держи в банке», а я не верю

Сел повайбкодить семейную ипотеку и немного офигел.

Даже при росте стоимости квадратного метра с 570 до 1,3 млн ₽ у меня выигрывает банковский вклад. Причём я ещё занизил его доходность в расчётах до 10%, хотя сейчас можно найти 15,5%.

Не могу понять — либо с калькулятором что-то не так, либо с моей картиной мира.

🧮 Калькулятор здесь: https://artwist-polyakov.github.io/loan_dashboard/

JSON для импорта с моими параметрами будет в первом комментарии.

Почему это вообще странно

На бумаге семейная ипотека под 6% против вклада под 15,5% (по данным ЦБ в ноябре 2025) выглядит как сказка. Разница в 2,5 раза — кажется логичным зафиксировать дешёвую ипотеку и пусть инфляция всё съест.

💡 В интуитивной модели "бетон против рубля" квартира при такой разнице ставок должна рвать вклад. Но калькулятор упорно показывает обратное.


🤖 Как это сделано

Переменных адски много: первый взнос, график платежей, рост стоимости, аренда, налоги, реинвестирование процентов по вкладу. Там где глаза разбегаются, мы просим LLM помочь.

Я попросил Claude Opus 4.5 собрать интерактивный дашборд. В нём я сравниваю три сценария: покупка-продажа, покупка-аренда-продажа и просто вклад как альтернатива.

Парадокс: вклад всё равно побеждает

Дальше началась магия и мои сомнения:

📌 При цене квадрата 570 тыс. ₽ → вклад выгоднее
📌 При росте до 1,3 млн ₽ через 10 лет → всё равно вклад выгоднее
📌 Добавляю доход от аренды → картина почти не меняется

🆘 Помогите найти ошибку

Где я накосячил в расчётах? Неправильно считаю рост стоимости, аренду, реальную доходность вклада или при текущих ставках вклад действительно выгоднее ипотеки?

----

Поляков считает — про ИИ, рекламу и аналитику.
34👀3🔥2👍1
Головоломка для маркетологов: как победить в ценовой войне без скидок

Сегодня разберу бизнес-кейс, который заставил меня по-новому взглянуть на стимулирование продаж. Рекомендую сначала прочитать условия задачи, подумать самостоятельно, а потом смотреть решение в комментариях.

🔥 Исходные данные

Консультирую производителя дымоходов по онлайн-маркетингу. Три сайта (магазин и два лендинга), реклама, поток лидов, долгий цикл сделки.

На входе классический набор проблем:

Проблема №1 — розница убивает маржу

Мелкие заказы приносили копейки. Экономика рекламы не сходилась — стоимость привлечения клиента съедала прибыль.

Проблема №2 — крупные заказы сливались

Иногда прилетали сделки на 500-900 тысяч рублей. Но их систематически проигрывали:

🔸 По цене — конкуренты давали скидки до 30-40%

🔸 По логистике — везти дымоходы в Ростов или Нижний Новгород выходило дорого, что отражалось в итоговой цене

При этом именно крупные заказы критически важны: в дымоходах высокая маржа, и одна такая сделка может покрыть весь месячный бюджет на маркетинг.

🤔 Вопрос-головоломка: как закрывать дорогие сделки без участия в гонке скидок и сделать доставку в регионы экономически выгодной?


Подсказка: это не про лидген, холодный обзвон или хитрые воронки. Просто четкая тактика, которая обычно не приходит в голову руководителю отдела продаж.

💬 Решение опубликую в первом комментарии

В первом комментарии будет ответ под спойлером, я не призываю, что он единственно верный, но он сработал.

----

Поляков считает — про ИИ, рекламу и аналитику.
2🔥8👍42
Kling O1: унифицированная видео-модель с большими амбициями и предсказуемыми проблемами

1 декабря компания Kuaishou выпустила Kling O1 — первую «унифицированную мультимодальную видео-модель». Звучит амбициозно, но давайте разберемся, что это значит на практике.

🎬 Что такое Kling O1

Kling O1 объединяет семь функций в одном движке: генерацию видео по тексту, по картинке, по референсам, редактирование существующего видео, замену объектов, изменение стилей и расширение клипов. Вместо того чтобы прыгать между разными инструментами, теперь можно делать всё в одном месте.

Технически это выглядит интересно — модель использует Chain-of-Thought рассуждения для интерпретации промптов и поддерживает до 10 референсных изображений одновременно через синтаксис "@". Например, можно написать: "Возьми персонажа из @image1, помести его в окружение из @image2 и примени стиль из @image3".

💡 Ключевая идея: вместо отдельных инструментов для генерации и редактирования — один движок, который понимает текст, картинки и видео как единый контекст.


🏆 Маркетинг против реальности

Внутреннее тестирование Kuaishou показало впечатляющие результаты: модель превзошла Google Veo 3.1 в задачах с референсами на 247%, а Runway Aleph в трансформации видео на 230%.

Но есть три проблемы с этими цифрами:

1️⃣ Тестирование проводилось самой компанией, без независимой верификации

2️⃣ Пользователи в реальности сталкиваются с багами: долгое ожидание, зависания генерации на 99%, проблемы с качеством

3️⃣ Как отмечают практики (включая меня), базовые функции вроде замены объектов работают хуже, чем в предыдущих версиях

🔍 Практический опыт

В нашем агентстве мы сейчас используем только два инструмента для видео: veo3 через API и Kling. Оба они заняли свою нишу не из-за революционности, а благодаря стабильности и предсказуемости результата.

С выходом Kling O1 я ожидал качественного скачка. Попросил модель заменить бутылки на видео на банки пива — результат разочаровал. Кажется, что предыдущая версия справлялась лучше.

Парадокс AI-видео индустрии: каждое обновление обещает революцию, но на практике часто получается один шаг вперед, полшага назад.


⚖️ Что действительно полезно

Несмотря на критику, есть моменты, где Kling O1 действительно удобен:

🔸 Референсная система с "@" синтаксисом упрощает работу с множественными элементами
🔸 Встроенный аудио движок Kling-Foley генерирует звук синхронно с видео
🔸 Возможность комбинировать несколько операций в одном запросе экономит время

Но эти преимущества работают только тогда, когда сама генерация не глючит.

🎯 Итого

Kling O1 — это попытка сделать «всё в одном», что теоретически правильное направление. Но на практике унификация пока не означает улучшение качества.

Для агентств и продакшенов я бы рекомендовал подождать несколько месяцев, пока модель стабилизируется. А тем, кто экспериментирует с AI-видео — протестировать самим и сравнить с уже работающими инструментами.

Какие AI-видео инструменты используете вы в работе? Замечали ли, что новые версии иногда работают хуже предыдущих?

----

Поляков считает — про ИИ, рекламу и аналитику.
24👍3🔥1
Почему программисты защищают право писать код вручную?

Последние месяцы — волна постов про то, как ИИ отупляет программистов. Потеря компетенций, "наркотик для мозга", закрытый найм для "подсевших на нейрокодинг". Наткнулся на пост Антона Волкова. Мем про отупение оттуда.

Хочу сказать кое-что непопулярное.

🎯 Главное, что дал ИИ-кодинг

Когда слышу, что кто-то защищает ручное написание, сразу делаю вывод, что цель человека — это не продукт, это сам код. А у бизнеса цель — продукт. ИИ-кодинг повлиял на двух участников рынка:

Для продуктов и предпринимателей: исчезло посредничество между идеей и прототипом. Теперь можно довести идею до работающего продукта самому — без недели переговоров о том, почему "это невозможно" или "нужно много минералов".

Для разработчиков: власть смещается к тем, кто мыслит продуктом, контролирует результат, оценивает бизнес-метрики. Писать код ради кода больше не выйдет — нужны продуктовые компетенции. Зато программист с ИИ — не дешевле, а дороже.

🎨 Когда красиво важнее, чем работает

Отношение к коду как к предмету искусства — главная ошибка. Код — способ заставить компьютер что-то делать. Ценность в том, что он делает, а не кто его написал.

🙋 Я сам грешил: бесился от ветки else с return — некрасиво же! Но это идеальный маркер разрыва между человеческой эстетикой и машинной логикой. Код работает, багов нет — просто мне этот код не нравится, вкусовщина.


💼 Про "критические системы"

Да, есть системы, где цена ошибки — катастрофа. Но большинство кода в мире к ним не относится.

Код — управляющие команды.

Как директор управляет предприятием через приказы, так программист управляет компьютером через код. Никто не хранит приказы директора в музее. Их исполняют — или предприятие умирает.


Вот и код в музее не надо хранить.

📊 А что говорят данные?

Accenture в RCT с 450 разработчиками: +15% к merge rate, на 84% больше успешных сборок.

Я сам недавно рефакторил Cloud Function на Яндекс.Облаке — коду 6 лет. С Claude Code это заняло меньше минуты, вручную ушло бы полдня.

P.S. Исследование METR показало, что опытные разработчики с ИИ работают на 19% медленнее — но только на своих репозиториях, которые знают годами. Когда создаёшь новое — расклад другой

Вы делаете продукт — или пишете код?

----

Поляков считает — про ИИ, рекламу и аналитику.
2👍52🔥2👎1
У меня есть 3 пасса на Claude Code — забирайте

Anthropic запустили guest passes: подписчики Max могут раздать друзьям 7 дней Pro-плана с полным доступом к Claude Code.

🎁 Что получите: полный Pro на неделю, включая Claude Code

📋 Что нужно: зарубежная карта + никогда не были платным подписчиком Claude

Без зарубежной карты попробовать не получится.

⚠️ Важный нюанс: после триала подписка автоматически продлится за деньги, если не отменить. Так что ставьте напоминалку.


Если давно хотели попробовать ИИ-кодинг с помощью Claude Code и его лучшей модели Opus 4.5 — пишите в комментарии или в личку, дам пасс.

UPD: все пассы закончились, если у кого-то есть — пишите в чате.

----

Поляков считает — про ИИ, рекламу и аналитику.
33👍1
Как я потратил неделю на "простую" задачу извлечения данных

Задача звучала элементарно: вытащить список услуг из PDF-договора. Pydantic-схема, пара промптов — что может пойти не так?

Оказалось, всё.

🔍 Проблема: масштаб убивает точность

В типичном договоре — 200-300 услуг. Даже Qwen 256B на таком объёме выдаёт только 90% списка. Звучит неплохо, пока не осознаёшь: оператору придётся вручную искать, какие 20-30 услуг модель потеряла.

По трудозатратам это ничем не отличается от ручного ввода всех услуг. Зато с ИИ.

🛠️ Попытка №1: LangExtract от Google

Библиотека с 17 000 звёзд на GitHub, красивые демки, обещания "Optimized for Long Documents: Overcomes the "needle-in-a-haystack" challenge бла бла бла...". Идеально же?

Реальность оказалась другой:

🔸 Даже на MacBook Pro M4 Max с 48GB unified memory один документ мог обрабатываться по 60 минут
🔸 Библиотека режет текст на чанки по 1000 символов — и, ТАААА-ДАААА-ММММ, ломает таблицы пополам
🔸 use_schema_constraints работает только с Gemini, для остальных моделей — рулетка с форматом ответа
🔸 В issues на GitHub — десятки жалоб на некорректный JSON

💡 Покопался в коде и обнаружил: langextract — это просто обёртка над промптами. Никакой магии, только нарезка текста и склейка примеров в запрос.


🤖 Попытка №2: Локальные модели через Ollama

Раз железо позволяет — протестировали разные модели: qwen3-30b, gpt-oss:20b, gemma3:27b. Для проверки использовал свой старый needle-in-a-haystack тест с вымышленными сущностями.

Результаты... своеобразные:

🔸 gemma3 считала "VX-6R" и "аккумулятор" живыми существами — а вымышленных из теста не нашла
🔸 Один и тот же атрибут в разных запусках оказывался в разных ключах: то "factor", то "attribute", то "characteristics"
🔸 JSON постоянно обрезался на середине или содержал синтаксические ошибки

Больше параметров ≠ лучше результат. gpt-oss:20b работал стабильнее мелких моделей, но всё равно терял данные на длинных документах.

📄 Корень проблемы: не модель, а данные

Копнул глубже и понял: дело не только в LLM. Дело в том, что приходит на вход.

OCR выдаёт текст с нарушенным порядком элементов. Из-за небольшого наклона скана строки таблицы "съезжают". Вместо логичного "Лифтер | 72 часа | 2913₽" получаем:


Лифтер
72
Специалист, ответственный за организацию...
2913,00
72...
Водитель погрузчика


Модель видит кашу и выдаёт кашу.

Решение: дизайн важнее модели

Отказались от полной автоматизации. Новый подход:

1️⃣ Человек загружает скан и показывает, где начинается и заканчивается таблица с услугами

2️⃣ Парсим первую страницу, чтобы понять структуру заголовков через LLM.

3️⃣ Запускаем параллельное извлечение — каждая страница обрабатывается параллельно.

Ключевой момент: не пытаемся восстановить таблицу из OCR-каши. Работаем с сырым текстом — LLM справляется.

На уровне одной страницы модели Qwen и Gemma до 32B справляются отлично. Быстро, дёшево, без галлюцинаций. 100% услуг извлечены.

🎯 Вместо того чтобы заставлять ИИ делать всё, мы дали ему задачу по силам. Человек тратит 30 секунд на разметку — и получает 100% точность вместо 90%.


----

Какой самый неожиданный затык вы встречали в "простых" задачах с ИИ?

----

Поляков считает — про ИИ, рекламу и аналитику.
3🔥102👍2
Channel name was changed to «Поляков считает: AI, код и кейсы»
Голосование 2025: если одна подписка на AI, то какая?

Хочется подвести итоги года, но тема AI настолько многогранна, что непонятно с какой стороны заходить. Год выдался невероятным на релизы — каждый месяц что-то переворачивало представление о возможном.

Мы с коллегами по AI-комьюнити решили провести серию голосований — каждый в своём канале, по своей номинации. В итоге соберём срез: какие компании и явления стали знаковыми для ИИ в 2025.

🗳️ Темы

🔸 Одна подписка года — Поляков считает: AI, код и кейсы
🔸 Код с ИИ в 2025 — Глеб Кудрявцев про AI кодинг
🔸 Событие года в AI Coding — Тимур Хахалев про AI Coding
🔸 AI Headliner года — Константин Доронин
🔸 ИИ-компаньон года — Бунак и Цифра: chatGPT / AI в бизнесе

Это авторские каналы, без репостов новостей. Если еще не подписались, очень советую.

📊 Моя эволюция

В 2024 я обходился ChatGPT Plus и Claude Pro. В 2025-м список разросся: ChatGPT, Claude Max, Perplexity, Google AI, Cursor, Poe, Krea, Kling, ElevenLabs, Make...

💡 Когда-то думал, что одной нейросети хватит на всё. Оказалось, специализация побеждает универсальность — и кошелёк страдает.


Мои предпочтения за год менялись сильно. В начале года — поклонник ChatGPT. По мере развития кодинг-агентов стал адептом Claude. Потом офигел от точного контекста Gemini на миллион токенов. А затем снова полюбил ChatGPT за Codex.

🏆 Кандидаты — все по $20/мес

ChatGPT Plus — GPT-5, ChatGPT Image, Codex для кода, DeepResearch для глубокой аналитики. Универсальный комбайн.

Claude Pro — сильнейший в работе с текстом и кодом. Claude Code в комплекте. жесткие лимиты.

Google AI Pro — контекст на миллион токенов, NotebookLM, генерация фото и видео через Veo и Nano Banana, кодинг-агент Antigravity.

Perplexity Pro — доступ к GPT, Claude, Gemini в одном месте. Лучший для поиска в интернете с цитатами на источники.

💰 Все базовые подписки выровнялись на $20/мес, премиум — на $200. Рынок нащупал якоря.


🎯 Мой выбор

Сейчас на Claude Max за $100 — считаю лучшим для работы. Но понимаю, что это вкусовщина. Интересно, что выберете вы.

----

Поляков считает — ИИ, код и кейсы.
34🔥3👍2
Media is too big
VIEW IN TELEGRAM
Kling научился переносить движения с любого видео на вашу фотографию

Долго ждал, когда ИИ позволит улучшить видео из молодости — ну, чтобы внукам показать, как дед ногами размахивал.

В 2006 всё снималось на первые телефоны, качество так себе.

Пробовал разные апскейлеры — результат отстой, покажу в комментариях. И вот теперь можно просто взять любое видео и надеть на себя (или любого персонажа).

🎬 Что такое Motion Control

Kling выкатил фичу, которая реально работает. А рекламный ролик-то какой крутой.

Суть простая:

🔸 Загружаешь референсное видео (танец, трюк, жесты)
🔸 Загружаешь свою фотографию
🔸 ИИ переносит движения кадр за кадром на твоего персонажа

Это не Motion Brush, где рисуешь траектории вручную. Motion Control извлекает всю хореографию из видео-образца и применяет её к статичному изображению.

💡 По сути: берёшь любое видео с YouTube — брейк-данс, прыжок с парашютом, полёт на крыле самолёта как у Тома Круза — загружаешь свою фотку, и вот ты уже это делаешь.


🔧 Как протестить?

Мануал: app.klingai.com/global/quickstart/motion-control-user-guide

Галерея работ комьюнити для вдохновения: app.klingai.com/global/activity-zone

Сам инструмент находится тут https://app.klingai.com/global/video-motion-control/new — это вкладка Video, не O1.

⚠️ Ложка дёгтя

Kling работает через веб — никаких установок приложения не нужно. Но есть нюансы:

🔸 Кредитная система непрозрачная — одна и та же генерация может съедать разное количество кредитов
🔸 Бесплатные кредиты сгорают, если не использовать в тот же день
🔸 Саппорт, по отзывам, практически не отвечает. Сам пробовал — нашел ответы в Дискорде.
🔸 Непрозрачное лицензирование. Я так и не смог понять, есть ли у меня права на коммерческое распространение.

Но для экспериментов — вполне рабочий инструмент.

💭 Мысль напоследок

На базовые движения нет авторских прав. Приседания, отжимания, танцевальные связки — вот это всё фольклор и общественное достояние.

А значит, любой фитнес-блогер теперь может «клонировать» тренировки любого инструктора, надев их на свою внешность. Или наоборот — продавать свой образ, который выполняет чужие программы.

----

Поляков считает — AI, код и кейсы
44👍2🔥1
Claude for Chrome: Anthropic тихо выпустил браузерного агента для всех

Пока все следили за OpenAI и Perplexity, Anthropic вчера открыл Chrome-расширение для всех платных подписчиков. Без громких анонсов — просто обновление в документации.

🕹️ Что умеет агент

Claude теперь управляет браузером: кликает, заполняет формы, переключается между вкладками. Работает в связке с Claude Code — пишешь код в терминале, тестируешь в браузере, Claude читает консольные ошибки и DOM напрямую.

💡 По сути это полноценный агентный браузер на базе Chrome — даёшь задачу, агент сам разбирается, куда нажать и что ввести.


Попробовал создать счётчик в Яндекс.Метрике с целью — агент справился за 5 минут. На подписке Max потратил 2% лимита, на Pro ушло бы около 10%. И это модель Haiku — самая дешевая.

⚙️ Ключевые фишки

🔸 Есть возможность выбора модели: Haiku 4.5, Sonnet 4.5 или Opus 4.5.

🔸 Можно создавать задачи по расписанию из промптов Есть шорткаты — быстрые команды.

🔸 Teach Claude — записываешь действия, Claude учится и повторяет

🔸 Мультитаб — агент работает с несколькими вкладками одновременно


🛡️ Про безопасность

Пишут, что успешность prompt-injection атак снизили с 23.6% до ~1% — но только на Opus 4.5, самой дорогой модели. Это лучше Comet от Perplexity, где летом шумели уязвимости.

Сразу заблокировали: финансы, крипто, банки. Логично — там самые высокие риски. Для действий на сайтах ведется отдельный лист разрешений.

🎯 Почему это важно

Anthropic сделали поздно, но правильно:

1️⃣ Классический Chrome — не нужно переучивать пользователей

2️⃣ Работают с существующими логинами — агент действует от имени юзера

3️⃣ Серьёзно подошли к безопасности — в отличие от Comet, который запустился с дырами

4️⃣ Идея с группами вкладок — шикарная. Задал вопрос и все диалоги из него будут открываться внутри одной группы вкладок. Понятная связь и организация. Не будет замусоревания.

Если раньше Comet выглядел достойной альтернативой, теперь Claude выравнивается с рынком. А учитывая качество моделей — может и обогнать.

📌 Расширение: https://claude.com/chrome
📌 Безопасность: https://support.claude.com/en/articles/12902428-using-claude-in-chrome-safely

Другие посты про ИИ-браузеры:
Атлас — анонс, безопасность, цензура
Комет — анонс

----

Поляков считает — AI, код и кейсы
63👍2🔥1