Прогрес! GPT-5 Pro зміг впоратися і вирішити цю НАЙСКЛАДНІШУ ЗАДАЧУ, з якою, нагадую, не впоралася ЖОДНА нейронка кінця 2024 року.
Йому знадобилося аж 10 хвилин для цього!
Після цього я спробував Claude 4.1 Opus, і що ви думаєте? Клод думав протягом 2х хвилин і...ВІН ТЕЖ НАПИСАВ ПРАВИЛЬНИЙ КОД!
Треба враховувати, що GPT-5 Pro має доступ до інтернета і ймовірно (окрім відео про куріння) міг підгледіти рішення інших людей, тому я на 100% не впевнений чи це його заслуга.
Але факт залишається фактом, нарешті ця задача була вирішена ШІ!
🔗 Код: https://gist.github.com/Latand/626698a0d249beb463bd4baff1981430
Йому знадобилося аж 10 хвилин для цього!
Після цього я спробував Claude 4.1 Opus, і що ви думаєте? Клод думав протягом 2х хвилин і...
Треба враховувати, що GPT-5 Pro має доступ до інтернета і ймовірно (окрім відео про куріння) міг підгледіти рішення інших людей, тому я на 100% не впевнений чи це його заслуга.
Але факт залишається фактом, нарешті ця задача була вирішена ШІ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1 2 1 1
UPD по 21 задачі:
- ✅ GPT-5 Thinking (не PRO) — впорався за 5хв!
- 🚫 Claude 4 Sonnet — не впорався.
- 🚫 GPT-5 Mini Thinking — не впорався
- 🚫 GPT-5 (Без Thinking) — не впорався
- ✅ GPT-5 Thinking (не PRO) — впорався за 5хв!
- 🚫 Claude 4 Sonnet — не впорався.
- 🚫 GPT-5 Mini Thinking — не впорався
- 🚫 GPT-5 (Без Thinking) — не впорався
Вайбкодинг через Github Actions
Я винайшов для себе дуже зручний flow, особливо для простих фіч. По суті виходить щось схоже на OpenAI Codex, але через інтерфейс на Github.
По суті, я собі додав агента на Claude Code в репозиторій в
Здається, що за замовчуванням він ще запускає автоматично огляд вашого PR, але я в себе це вимкнув і запускаю лише коли пишу @claude-review.
Зараз граюсь ось так:
- Є ідея, що треба зробити, чи то багфікс, чи нова фіча — пишу це в телеграм щоб не забути. Потім створюю issue
- В issue я тегаю клода і описую йому свою задачу і те як я думаю це треба імплементувати.
- Також я прошу його придумати кращу назву і опис для цього issue (бо пишу я досить хаотично)
- І головне - я прошу його зробити власний research проєкту і визначити наперед які файли релевантні для цієї задачі (важливо для наступного етапу)
Після цього він робить цей план, а я роблю щось інше. Повертаюсь, перечитую, змінюю щось і тегаю знову щоб він почав роботу, якщо план виглядає нормально.
Можливо комусь захочеться це повторити — пишіть, потім покажу як налаштувати собі такого агента і підключити до вашої підписки на Claude.
Промпт, що на скрині, доступний для копіювання в коментарях до цього посту.
Я винайшов для себе дуже зручний flow, особливо для простих фіч. По суті виходить щось схоже на OpenAI Codex, але через інтерфейс на Github.
По суті, я собі додав агента на Claude Code в репозиторій в
.github/workflows/, який реагує на мої коментарі, або issue, запускається віддалено і здатний робити коміти, коментити PR'и або Issue.Здається, що за замовчуванням він ще запускає автоматично огляд вашого PR, але я в себе це вимкнув і запускаю лише коли пишу @claude-review.
Зараз граюсь ось так:
- Є ідея, що треба зробити, чи то багфікс, чи нова фіча — пишу це в телеграм щоб не забути. Потім створюю issue
- В issue я тегаю клода і описую йому свою задачу і те як я думаю це треба імплементувати.
- Також я прошу його придумати кращу назву і опис для цього issue (бо пишу я досить хаотично)
- І головне - я прошу його зробити власний research проєкту і визначити наперед які файли релевантні для цієї задачі (важливо для наступного етапу)
Після цього він робить цей план, а я роблю щось інше. Повертаюсь, перечитую, змінюю щось і тегаю знову щоб він почав роботу, якщо план виглядає нормально.
Можливо комусь захочеться це повторити — пишіть, потім покажу як налаштувати собі такого агента і підключити до вашої підписки на Claude.
Промпт, що на скрині, доступний для копіювання в коментарях до цього посту.
1 4
Як встановити собі Claude Code Github Agent:
1. Заходимо в Claude Code, вводимо команду
3. Вибираємо репозиторій
4. Вибираємо рівень доступу (краще надати доступ до всіх репо відразу)
5. Вибираємо які workflow встановити — один на тег @claude, інший — для рев'ю (другий буде робити рев'ю на кожний коміт)
6. Вибираємо доступ з вашою підпискою (не API key)
7. Приймаємо PR від клода з цими workflow
8. (Опціонально) Змінюємо workflow так як там хочеться
📹 Детально у Відео: https://youtu.be/0kJh4KuJ1nY
Пишіть в коментарях чи вийшло у вас це зробити)
1. Заходимо в Claude Code, вводимо команду
/install-github-app3. Вибираємо репозиторій
4. Вибираємо рівень доступу (краще надати доступ до всіх репо відразу)
5. Вибираємо які workflow встановити — один на тег @claude, інший — для рев'ю (другий буде робити рев'ю на кожний коміт)
6. Вибираємо доступ з вашою підпискою (не API key)
7. Приймаємо PR від клода з цими workflow
8. (Опціонально) Змінюємо workflow так як там хочеться
Пишіть в коментарях чи вийшло у вас це зробити)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4 4 2 2
This media is not supported in the widget
VIEW IN TELEGRAM
Вчора Telegraph опублікував статтю "Попереджувальні знаки що бульбашка ШІ от-от лопне". Акції впали: Nvidia -3.5%, Palantir -9%. Журналісти пишуть що 95% компаній отримують нуль від інвестицій в штучний інтелект.
Але я прочитав оригінальне дослідження MIT NANDA "Стан ШІ в бізнесі 2025", і там дещо інша картина.
Що насправді каже дослідження:
Telegraph: "95% організацій отримують нульову віддачу від ШІ"
MIT: "95% пілотних проєктів застрягли без вимірюваного впливу на прибутки"
Відчуваєте різницю? Це не "ШІ ніколи не спрацює", а "поточні підходи до впровадження не працюють".
Головні перешкоди (за MIT):
• Користувачі опираються інструментам що не адаптуються
• Якість моделі погіршується без контексту
• Поганий користувацький досвід
• Брак підтримки керівництва
• Складне управління змінами
Зверніть увагу: 4 з 5 проблем - це не технологічні обмеження ШІ, а проблеми інтеграції. Ті самі проблеми виникають при впровадженні будь-яких нових систем.
Цікаві знахідки з дослідження:
1. Тіньова економіка ШІ - 90% працівників використовують ChatGPT чи Claude для роботи, але лише 40% компаній офіційно купили підписки. Люди платять $20/місяць зі своєї кишені і отримують більше користі ніж від корпоративних рішень за $50 тисяч.
2. Індекс змін - лише 2 з 8 індустрій показують структурні зміни: технології та медіа. Охорона здоров'я, енергетика, фінанси - майже без змін. Це не провал ШІ, це різна готовність секторів.
3. Парадокс рентабельності - "хоча продажі та маркетинг отримують більшість уваги та інвестицій, автоматизація внутрішніх операцій може дати більш значні та стійкі результати". Інвестують в маркетинг, а реальні гроші у внутрішніх процесах.
Що це означає:
Ми бачимо класичний цикл хайпу Гартнера. Після піку завищених очікувань йде провалля розчарування. Це нормально для нових технологій.
Згадайте бульбашку доткомів 2000 року. Amazon впав з $107 до $7. Але інтернет нікуди не зник. Ті хто вижив - стали гігантами.
З ШІ буде те саме. Відсіються ті хто продає "загальний штучний інтелект завтра", залишаться ті хто вирішує конкретні проблеми. І судячи з дослідження - такі вже є. Ті самі 5% що "отримують мільйони в цінності".
Підсумок:
Це не "лопнула бульбашка ШІ", це перевірка реальністю. Технологія працює, але потребує правильного підходу. Компанії які зрозуміють що ШІ - це не чарівна кнопка, а інструмент що потребує інтеграції та адаптації - виграють.
А Telegraph... ну що ж, заголовки-приманки завжди продаються краще ніж збалансований аналіз.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Як бачать роботу з Claude code, ті хто його не використовував 😜
Пробую сьогодні Codex CLI (по підписці з ChatGPT)
Кажуть gpt-5 high дуже гарний, цікаво перевірити
https://github.com/openai/codex
Кажуть gpt-5 high дуже гарний, цікаво перевірити
https://github.com/openai/codex
GitHub
GitHub - openai/codex: Lightweight coding agent that runs in your terminal
Lightweight coding agent that runs in your terminal - openai/codex
Знаєте чого не вистачає? такого агента в браузері, коли знаходишся на сторінці і просто в чатику просиш його змінити/зробити щось на сайті
Щоб був такий UX як в claude code (в openai він гірший, до речі ), і юзалась вже існуюча підписка на клод/openai
Мені здається багатьом може зайти така штука, можна навайбкодить розширення для цього.
@LyChat?
Щоб був такий UX як в claude code (
Мені здається багатьом може зайти така штука, можна навайбкодить розширення для цього.
@LyChat?
Хочу розказати про досвід з Claude Code та OpenAI Codex CLI, що краще, пост, відео, стрім?
Forwarded from Celestia
У якому форматі поділитися досвідом про Claude Code та OpenAI Codex CLI?
Anonymous Poll
60%
Пост (стаття)
32%
Відео
7%
Стрім (лайв)
Vibecoding Haven (BotfatherDEV)
Знаєте чого не вистачає? такого агента в браузері, коли знаходишся на сторінці і просто в чатику просиш його змінити/зробити щось на сайті Щоб був такий UX як в claude code (в openai він гірший, до речі ), і юзалась вже існуюча підписка на клод/openai Мені…
Опа. Майже те що треба
https://x.com/AnthropicAI/status/1960417002469908903?t=kDEr7DOwbFW5ITUv2KKIMA&s=09
Ну... Я подав заявку (але зараз лише research preview)
https://x.com/AnthropicAI/status/1960417002469908903?t=kDEr7DOwbFW5ITUv2KKIMA&s=09
Ну... Я подав заявку (але зараз лише research preview)