Idea Maze – Telegram
Idea Maze
242 subscribers
25 photos
2 videos
29 links
Ex-Head of Product из Авиасейлс об AI, продуктах и менеджменте

@pavlovm
Download Telegram
На прошлой неделе пришёл комплект SO-100 Arm. Это робо-рука от HuggingFace, с моделями из LeRobot её можно научить выполнять простые задания, типа сортировки предметов в зоне видимости. Буду потихоньку собирать и разбираться.
🔥1
Я не сидел сложа робо-руки (извините). Прошёл почти месяц, можно и продолжение написать.

SO-100 это набор для нежного погружения в мир робототехники. Всё продумано, туториалы есть, бери и делай. Ну, или так кажется

Для демо выбираем простую задачу, например, научить руку класть блок лего в коробку. Порядок шагов выглядит так:
1. Собираем руку-leader и руку-follower
2. Подключаем к компу и калибрируем все моторы
3. Записываем датасет из раз за разом успешно выполненных задач
4. Файнтюним на нём базовую нейройнку
5. Профит! Если не профит, повторяем шаги 3-4.

С первой сложностью я столкнулся сразу после калибровки. Попытавшись управлять ведомой рукой с клавиатуры (я опрометчиво оставил ноут в зоне её досягаемости и она чуть не столкнула его со стола), я услышал как один из моторов жужжит громче чем нужно. Сделать что-то я не успел: жужжание прекратилось, но зато появилась струйка дыма и запах гари 🧑‍🚒

Тогда я понял, что игнорировать сообщения о том, что температура одного из моторов высоковата (60 градусов), вероятно не стоило.

Жду новый мотор.
PS. Скорее всего дело в том, что я неправильно собрал тот сустав. Но это не точно. Поэтому заказал 2 мотора на всякий случай.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩4🔥2😱1
Я люблю покер и много копаюсь с моделями. Идея проекта родилась сама собой.

PokerBattle – сайт, где можно следить как разные LLM-ки играют в покер между собой. Целевое состояние — 7-дневный ивент где 6 разных сеток играют в кэш между собой, с возможностью смотреть игру в прямом эфире и историю раздач.

Задача мега нетривиальная. Я не разработчик, поэтому главный риск здесь это смогу ли я, обложившись разными AI-инструментами, довести идею до прода.

Если в двух словах, архитектура выглядит так:
* Сервер на питоне, управляет игровой сессией, столами и раздачами. Питон, потому что на нём написан единственный покерный движок PokerKit.
* Данные о живых раздачах и история раздач, статистика игроков хранятся в Supabase
* Фронтенд на Next.js в Vercel

Итоги первой недели:
* Выбраны все технологии, собран проект
* Есть архитектура проекта
* Готова база данных и слой для работы с ней
==== В процессе ====
* Логика ведения и сохранения раздачи

Рассчитываю сделать проект за месяц. Скоро напишу выводы из моего опыта вайб-кодинга.
5🔥4
Poker Battle: прогресс за вторую неделю.

* Есть бэкэнд, на котором можно запустить покерный стол и вводить действия игроков вручную. Покерная логика полностью работает.
* Есть база данных, в которой сохраняются состояния стола. Supabase умеет создавать топики, по которым можно подписаться на изменения в БД. Это тоже настроено (больше всего времени заняло разбирательство как настроить такой механизм для неавторизованных пользователей)
* Есть фронтенд, который подписывается на обновления таблицы и показывает всё что происходит на бэкэнде.

То есть уже можно смотреть на вебе раздачи.

Следующие шаги:
* Подключить LLM-игроков
* Сделать остальной интерфейс сайта
* Сделать подсчёт статистики и графики
* Сделать раздел с историей раздач

Неплохо идёт.
🔥5
Poker Battle. Прогресс за третью, четвёртую и пятую недели.

Надеюсь ни у кого не осталось сомнений, что я не буду регулярно писать в канал ))

По ощущениям проект готов процентов на 80%. Значит, остались последние 80%.

Что готово:
* LLM-игроки
* Заметки игроков друг на друга
* Лог событий за столом
* Статистика сессии
* Поддержка нескольких столов

Осталось сделать всё сложить в красивый интерфейс для просмотра.

Тем не менее я определился с датой старта — 27 октября. Оставшийся месяц я потрачу на доделки, тесты и промо.

Сегодня сделал лендинг: https://www.pokerbattle.ai/

Если у вас есть контакты людей из AI или покер related компаний, которые могли бы стать спонсорами, делитесь :)
🔥11😁1
Запостил на HN, поддержите лайком, пожалуйста!
https://news.ycombinator.com/item?id=45357321

Нужно залогиниться и поставить апвоут ❤️
9
PokerBattle. Что случилось на прошлой неделе.

Главный итог (благодаря вам ) — за прошлую неделю на лендинге побывало 470 человек.

— Больше всего трафика пришло из телеги
— r/poker дал немного трафика
— К постам на HN надо готовиться лучше (знал ли я об этом? да)
— Люди не подписываются на твиттер, чтобы следить за датами

На этой неделе займусь аутричем разных покерных и AI/DL сми, комьюнити, блогеров, рассылок, стримеров и тд.
И сделаю контентный план для реддита, нескольких комьюнити и твиттера.

Из интересного:
— Получил одно письмо про спонсорство. Посмотрим, чем закончится.
— Запитчил проект основателю конфы AI.engineer на мероприятии в Париже. Говорит, забавный проект, keep going. Это вообще была самая популярная реакция на мой питч.
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉1175
Poker Battle: остался 21 день до старта

За прошлую неделю случился аутрич в покерные сми и комьюнити. Впрочем, достаточно ленивый и не слишком масштабный — списки за меня собирал ChatGPT.
В результате у меня взял интервью Adam Hampton из Poker.org

Остальное:
* Сделал просмотр истории раздач
* Скоро расскажу про итоговый список моделей-участников
* Готовлюсь к деплою бекенда и тестовому прогону
🔥15👍4
Ну что, поехали. Турнир начинается :)
С текущего момента до вечера пятницы 9 LLM-игроков будут играть в покер за 4 столами.

Смотреть здесь: pokerbattle.ai
258🔥215👍5🎉1
База не выдержала )
Чиним!
🔥8😁8👍42
Должно стать лучше, заходите :)
11😁7🔥5
Мы на первом месте на HackerNews 👍

Помогите удержаться, заходите голосовать и комментировать.

Теперь я знаю секрет успеха HN: кто-то без твоего ведома должен тебя запостить, много людей поставить апвоут, а в комментах обсуждать в чём минусы проекта. C вас $100.
Please open Telegram to view this post
VIEW IN TELEGRAM
124👍13🔥11👏3🎉1
Промежуточные результаты после 24 часов игры
🔥12👍5
Всё, ну и неделька!
Отдохну и сделаю несколько постов с итогами, мыслями и выводами.
1🔥20👍3
«Даже у ИИ есть фиш, который все всем оплатит»: закончился покерный турнир среди языковых моделей

Экспериментальный покерный матч pokerbattle.ai среди нейросетей подошел к концу. Переживать, что искусственный интеллект скоро вытеснит со столов натуральный, пока не стоит — играли модели на уровне любителей с NL2, периодически путали карты и неправильно читали комбинации. Впрочем, следить было все равно интересно: каждое свое действие модели объясняли человеческим языком, нередко — довольно любопытно.

👉 Llama все-таки закаталась. Языковая модель от владельцев Facebook весь матч показывала настоящий уличный покер: держала 60% VPIP, вхолодную коллировала 3-беты и не сдавалась на агрессию. В одной из раздач она зашла под 5-бет с A♠️Т♠️, на доске 3♣️5♦️6♥️К♣️6♠️
дважды донкнула, а затем оплатила ривер с такими мыслями:
У меня хорошие пот-оддсы. По такой доске и линии розыгрыша у оппонента или велью, или блеф.


🧠 Хватало и хороших розыгрышей. Гугловская Gemini в 3бет-поте с J♦️J♣️ на доске J♥️9♠️8♠️А♣️7♠️ сыграла бет-бет-пас на ставку от DeepSeek с K♠️T♠️, объяснив это так:
Против меня – тайтовый соперник, его линия явно указывает на флеш. Сыграл колд-колл префлоп, оплатил две улицы на скоординированном борде и поставил ривер. Почти весь диапазон состоит из флешей, мой сет теперь — всего лишь блаф-кетчер, а придумать здесь достаточно блефов или велью слабее для колла сложно. Дисциплинированный фолд.


Такой анализ оценил даже Avr0ra:
Gemini очень хорошо все расписала, по такому анализу можно обучаться. Но не хватает объяснений в плане выбора сайзингов. Не покидает ощущение, что это постфактум подогнанный текст. Как будто их задание не расписать ход мысли, а просто описать уже сыгранную раздачу


💪 А регуляры среди вас есть? Триумфатором матча стала OpenAI o3 (одна из прошлых версий ChatGPT думала на ней), весь баттл выступавшая с 26 VPIP и 18 PFR — за 9-макс столом! Агрессивная игра на постфлопе и пара хороших кулеров позволили закончить матч с $36k профита (+18 бай-инов за 3,799 раздач).

Подробный разбор матча с комментариями Авроры читайте на GipsyTeam.
🔥9👍3🤩2
Что дали главная HackerNews и твит Илона Маска?
Главные итоги и выводы по продвижению PokerBattle.ai

За время жизни проекта на сайт пришло 64 тысячи уникальных пользователей. Много это или мало? Если учесть, что это только органическое продвижение и время жизни всего 5 дней — много.

Как развивались события.
До старта проекта:
– За 6 недель старта я сделал лендинг
– Написал пост в этом канале
– Написал посты на HackerNews и в профильные сабредиты
– Написал на LinkedIn нескольким покерным журналистам
– Запостил анонс в нескольких покерных сообществах

Какие результаты:
– HackerNews и Reddit практически ничего не принесли
– Русскоязычный телеграм (репосты в AI/ML каналах) принёс около 250 посетителей на сайт ❤️
– Аутрич журналистов принёс одно интервью на Poker.org, которое разошлось по другим медиа (+1000 посетителей размазанные на неделю) и привело к партнёрству с GipsyTeam

День 1:
– Анонс в этом канале
– Телеграм принёс около 1.1 тысячи пользователей. В основном каналы про AI/ML

День 2:
– Кто-то опубликовал проект на HackerNews. Он попал на главную и несколько часов держался на первом месте. За всё время оттуда пришло 11 тысяч человек.
– В конце дня я опубликовал пост в r/LocalLlama. Пост набрал 71 тысячу просмотров, 46 комментов и 283 апвоута.

День 3:
– Илон твитит скриншот турнирной таблицы. +300 фоловеров в X, онлайн на сайте 150 человек, за сутки 19 тысяч пользователей, вместе с остальной органикой.
– Штук 5 щиткойнов про PokerBattle

День 4 и 5:
– Длинный хвост органики с HackerNews и твита. Посты в разных медиа, ньюслеттерах, сетках телеграм каналов, покерных и айти медиа. Ещё около 17 тысяч пользователей в сумме за два дня.

Какие выводы (сейчас я вам всё ретроспективно объясню):
В моём случае сработала идея, она цепляла людей. Пост на HackerNews появился благодаря тому что кому-то проект понравился, а дошёл до главной в том числе из-за треда на тему «Почему LLM не предназначены для игры в покер» (абсолютно согласен). Две недели назад хайповал бенчмарк, где LLM торгуют акциями, про него я вообще не слышал ничего хорошего.

Если выводить из этого какую-то формулу успеха органического промо, то я бы описал так: вы должны стремиться тому, чтобы части людей идея показалась интересной, а части — очевидно плохой. Когда я придумывал проект, я много думал про первых.
Это прям очень плохо перекладывается на for profit продукты (если вы не делаете весёлое консьюмерское приложение). Так что совет не особо рассчитывать на органический трафик всё ещё в силе.

Второй большой вывод — вы не особо управляете виральностью такого рода. Большая часть усилий до запуска принесли 0 результата. Но если бы я ничего не делал, вероятность такого успеха упала бы на порядок.

Следующий пост будет про то, сколько я потратил на проект
5416👍10
Вот это удача 😂
😁153🔥1
Сколько стоило провести PokerBattle

Как обещал, рассказываю.
Основные статьи расходов сложились такие:
- Инструменты разработки (только Cursor)
- Инфраструктура
- Инференс моделей

Инфраструктура
Я использовал Supabase для хранилища и REST API для фронтенда (читаем и не осуждаем), Vercel для деплоя фронтенда, Fly.io в качестве сервера для игры и сервера для сбора логов LLM-ок.

Vercel — $20. Кредиты, которые я почти не потратил (только около $4 на аналитику).
Supabase — $25. Добавил компьюта и реплик после падения в первый день.
Fly.io — $12.5 за 2 машины.

Итого: $57.5

Cursor.
$160 за 2 месяца. Из них $120 on-demand использование сверх тарифа

Инференс моделей.
Как и ожидалось, это основная статья расходов. Я использовал Openrouter, где за всё время я нагонял 375М токенов. В общей сложности на модели ушло $789. При этом на сам турнир ушло $480, всё остальное — многочисленные тесты.

Топ 3 по тратам — Gemini, Claude, OpenAI o3. Интересно, что Grok 4 (fast), который занял 3 место, на последнем месте по расходам. Был бы это бенчмарк, я бы сделал какой-нибудь вывод.

Общий итог: $1006.5

Не переживайте (ну вдруг вы переживали), благодаря рекламе я окупил проект и вышел в плюс.

Дальше хочу написать по поводу технического устройства проекта и болезненных нюансов вайб-кодинга.
1🔥20👍42