Уявімо: ми почали активно вайбкодити / AI-кодити. Коду стало в 3 рази більше. І багів у проді стало в 3 рази більше.
Питання: це означає, що з AI ми почали писати гірший код?
Питання: це означає, що з AI ми почали писати гірший код?
Anonymous Poll
47%
Так
33%
Ні
13%
Не можна сказати точно (або не знаю)
6%
Інша відповідь - Напишу в коментах
Окей, продовжуємо
Якщо коду стало в 3 рази більше, але відсоток (щільність) багів не змінилась — що буде з кількістю багів?
Якщо коду стало в 3 рази більше, але відсоток (щільність) багів не змінилась — що буде з кількістю багів?
Anonymous Poll
60%
Багів стане в 3 рази більше
22%
Багів стане стільки ж
3%
Багів стане менше
15%
Залежить / потрібні дані
Тепер розв’язка
Я спеціально підкинув цих сферичних коней у вакуумі — щоб спіймати одну штуку: коли люди бачать фразу "багів стало більше" і автоматом читають це як "якість стала гірше". Ну і зв'язав це з ШІ)
Але є неочевидні моменти, які зазвичай губляться:
- "Багів стало більше" часто означає "краще ловимо" (Sentry/логування/QA/coverage).
- ШІ-рев’ю/перевірки теж можуть зробити "більше багів" — бо починаєш знаходити те, що раніше тупо пролітало. І це не завжди погано
- Важливіше не те скільки багів, а severity + вплив на юзера.
- Є лаг у часі: інциденти сьогодні можуть виникати відразу, а помітні потім.
- Юзерів/трафіку стало більше → багів “стало більше”, бо їх просто частіше тригерять і краще видно. Те, що при 100 юзерів вилізало раз на тиждень, при 10k юзерів вилізе 100 разів на день🙃
- І взагалі, з ШІ часто росте темп і кількість змін (PR/коміти/фічі).
Тому, багів більше може бути просто наслідком більше змін. Дивитись краще на баги на одну зміну/фічу і на інциденти після релізів(а їх буде менше, якщо будете постійно юзати ШІ-рев'ю)
От і все. Тепер, якщо хтось кидає «через ШІ стало більше багів» без контексту — ну… ви зрозуміли 😌
Я спеціально підкинув цих сферичних коней у вакуумі — щоб спіймати одну штуку: коли люди бачать фразу "багів стало більше" і автоматом читають це як "якість стала гірше". Ну і зв'язав це з ШІ)
Але є неочевидні моменти, які зазвичай губляться:
- "Багів стало більше" часто означає "краще ловимо" (Sentry/логування/QA/coverage).
- ШІ-рев’ю/перевірки теж можуть зробити "більше багів" — бо починаєш знаходити те, що раніше тупо пролітало. І це не завжди погано
- Важливіше не те скільки багів, а severity + вплив на юзера.
- Є лаг у часі: інциденти сьогодні можуть виникати відразу, а помітні потім.
- Юзерів/трафіку стало більше → багів “стало більше”, бо їх просто частіше тригерять і краще видно. Те, що при 100 юзерів вилізало раз на тиждень, при 10k юзерів вилізе 100 разів на день
- І взагалі, з ШІ часто росте темп і кількість змін (PR/коміти/фічі).
Тому, багів більше може бути просто наслідком більше змін. Дивитись краще на баги на одну зміну/фічу і на інциденти після релізів
От і все. Тепер, якщо хтось кидає «через ШІ стало більше багів» без контексту — ну… ви зрозуміли 😌
Please open Telegram to view this post
VIEW IN TELEGRAM
Після цих двох опитувань — ось вам корисний відос на цю тему. Там розповідають про "AI-код: хайп vs реальність" і чому люди часто роблять криві висновки.
https://youtu.be/rgjF5o2Qjsc?si=9qYRkhUeJkF_9sA0
TL;DR:
- AI реально піднімає output (більше задач/PR’ів/коду)
- рев’ю + валідація стають вузьким горлом (інколи навіть гірше по часу)
- довіра і якість ростуть, коли є тести + quality рев'ю + нормальний контекст (а не "тримай, моделько, 2 файли і роби магію")
https://youtu.be/rgjF5o2Qjsc?si=9qYRkhUeJkF_9sA0
YouTube
The State of AI Code Quality: Hype vs Reality — Itamar Friedman, Qodo
AI is making code generation nearly effortless, but the critical question remains: can we trust AI-generated code for software that truly matters? Has it really become easier to build robust, high-quality systems?
In this talk, we’ll separate hype from reality.…
In this talk, we’ll separate hype from reality.…
🚗 TRINITY — AI-агент на колесах від will.i.am
На CES 2026 will.i.am показав дещо цікаве: одномісну трьохколісну капсулу-EV, де головний апгрейд — не мотор, а ШІ-агент всередині. Концепт називають “Human + Vehicle + Agent”, і це виглядає як vibe-coding, але в залізі.
⚡️ Що обіцяють:
• Розгін 0–60 менше 2 секунд
• Топ-швидкість до 120 mph (~193 км/г)
• Self-balancing (само-балансування)
• Weatherproof салон + студійний звук
• Перша партія ~500 штук, ціна до $30k
🧠 Найцікавіше — “мозок”
Всередині стоїть NVIDIA DGX Spark — компактний AI-суперкомп’ютер з 128GB unified memory і до 1 PFLOP FP4. Тобто великі моделі можуть працювати локально, без хмари. Ідея в тому, що ти не просто “керуєш машиною”, а розмовляєш з нею як з напарником, який веде контекст твоїх цілей і маршрутів.
will.i.am (William James Adams Jr.) — американський музикант, продюсер, учасник Black Eyed Peas.
Але він також давно в tech-тусовці: інвестує в стартапи, співпрацює з компаніями типу Intel, і ось тепер показує власний AI-транспорт на CES.
На CES 2026 will.i.am показав дещо цікаве: одномісну трьохколісну капсулу-EV, де головний апгрейд — не мотор, а ШІ-агент всередині. Концепт називають “Human + Vehicle + Agent”, і це виглядає як vibe-coding, але в залізі.
⚡️ Що обіцяють:
• Розгін 0–60 менше 2 секунд
• Топ-швидкість до 120 mph (~193 км/г)
• Self-balancing (само-балансування)
• Weatherproof салон + студійний звук
• Перша партія ~500 штук, ціна до $30k
🧠 Найцікавіше — “мозок”
Всередині стоїть NVIDIA DGX Spark — компактний AI-суперкомп’ютер з 128GB unified memory і до 1 PFLOP FP4. Тобто великі моделі можуть працювати локально, без хмари. Ідея в тому, що ти не просто “керуєш машиною”, а розмовляєш з нею як з напарником, який веде контекст твоїх цілей і маршрутів.
This media is not supported in your browser
VIEW IN TELEGRAM
І в чому він неправий? 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Можливо ви вже це чули, але Gemini 3.0 Pro неймовірно круто робить UI дизайн!
продовжую роботу над голосовим асистентом)
попросив джеміні зробити редизайн)
продовжую роботу над голосовим асистентом)
попросив джеміні зробити редизайн)
🤖 Cursor виклали гайд по роботі з AI-агентами
Зібрали всі best practices в одну статтю. Більшість з цього я вже юзаю в Claude Code, але це дійсно непоганий гайд для тих хто досі не став ШІ євангелістом.
Цитата дня:
📎 https://cursor.com/blog/agent-best-practices
Зібрали всі best practices в одну статтю. Більшість з цього я вже юзаю в Claude Code, але це дійсно непоганий гайд для тих хто досі не став ШІ євангелістом.
Головні інсайти:
•Shift+Tab— Plan Mode, агент спочатку планує, потім кодить. Плани зберігаються в.cursor/plans/Від мене: Дуже важливо створювати план якщо очікувані зміни більше 100-200 рядків коду
• Довгі чати = втрата фокусу. Новий чат на кожну нову задачу
• Rules (.cursor/rules/) — статичний контекст для кожного чату. Skills (див. Claude agent skills)
• TDD з агентом працює найкраще — тести дають йому чітку ціль для ітерації
• Debug Mode — генерує гіпотези, додає логування, аналізує runtime. Для складних багів
• Можна запускати декілька моделей паралельно через worktrees і порівнювати результати
Цитата дня:
AI-generated code can look right while being subtly wrong
📎 https://cursor.com/blog/agent-best-practices
⚙️ Очікування vs Реальність вайбкодингу
Налаштовую собі cron job: щодня о 9:00 запускаються два sub-agents паралельно — один парсить GitHub Issues, інший лізе в ClickHouse аналізувати логи. Main Agent порівнює результати і кидає звіт в телеграм. Thinking: High. Краса!
Прокидаюсь, відкриваю телефон…
Ха-ха-ха прекрасно. Типовий Клод 🫠
Це все що вам треба знати про стабільність агентних систем. Розумний, вміє планувати, але коли треба працювати о 9 ранку — він теж не хоче
Вайбкодинг — це прекрасно, доки не впираєшся в ліміти API.
Налаштовую собі cron job: щодня о 9:00 запускаються два sub-agents паралельно — один парсить GitHub Issues, інший лізе в ClickHouse аналізувати логи. Main Agent порівнює результати і кидає звіт в телеграм. Thinking: High. Краса!
Прокидаюсь, відкриваю телефон…
{"type":"error","message":"Overloaded"}
Ха-ха-ха прекрасно. Типовий Клод 🫠
Це все що вам треба знати про стабільність агентних систем. Розумний, вміє планувати, але коли треба працювати о 9 ранку — він теж не хоче
Вайбкодинг — це прекрасно, доки не впираєшся в ліміти API.
Другий день користуюсь clawd.bot і дуже вражений
Насправді, ще давно були думки створити самому подібного бота, але так як це зробили тут - я б точно не став так заморочуватись
Мій кейс - скинув клоду цей сайт, описав свій кейс: бот що працює в одній групі (розробники Селестії), має доступ до продакшн бази/логів/трейсів, отримує повідомлення він мене, аналізує питання і відповідає в групі по результату
Фактично, використовує клод код на сервері (де є підписка), і допомагає швидше виявляти баги і створювати ішʼю, ну і звісно - виправляти їх
Тобто телеграм бот - це просто інтерфейс.
А ще, проєкт - опенсурсний (бот на js), тому можна попросити клода поправити його роботу так як вам треба.
Дуже дуже раджу
Насправді, ще давно були думки створити самому подібного бота, але так як це зробили тут - я б точно не став так заморочуватись
Мій кейс - скинув клоду цей сайт, описав свій кейс: бот що працює в одній групі (розробники Селестії), має доступ до продакшн бази/логів/трейсів, отримує повідомлення він мене, аналізує питання і відповідає в групі по результату
Фактично, використовує клод код на сервері (де є підписка), і допомагає швидше виявляти баги і створювати ішʼю, ну і звісно - виправляти їх
Тобто телеграм бот - це просто інтерфейс.
А ще, проєкт - опенсурсний (бот на js), тому можна попросити клода поправити його роботу так як вам треба.
Дуже дуже раджу