Vibecoding Haven (BotfatherDEV) – Telegram
Vibecoding Haven (BotfatherDEV)
2.6K subscribers
700 photos
109 videos
11 files
476 links
Ділюсь про те як стати продуктивнішим використовуючи AI в програмуванні.
Download Telegram
На LLM Arena насправді з'явилось нещодавно багато досить розумних моделек. Особисто мені сподобалися відповіді китайських minmax та qwen (великих).
Ну і по ціні вони звісно дешевше конкурентів
Claude Code — потужна штука, але вона обмежена лише клодом, і не можна, наприклад, легко переключитися на іншу модельку потестити, типу horizon.

Саме тому зараз набирають популярність альтернативи, серед яких є і опенсурсні (значить можна ще і під себе змінювати). І там можна вибирати серед моделек.

Але поки вигідніше буде юзати клод по підписці — їм буде важко)
2
Github Actions + Claude Code = Claude Bot❤️

• тегаєм Claude-бота, поправити тест і go fmt.
• Бот відповідає «ок, гляну». З’являється коміт «Fix failing test and Go formatting».
• CI-джоби стартують:
– Go fmt
– тести 491 / 491
Одним рядком: клод-бот підлатав і закомітив
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Всі чекали GPT5, але вийшов gpt-oss, ЛОКАЛЬНА версія LLM, яка пишуть що на рівні OpenAI o3, а запустити можна локально на high-end pc

Дуже цікаво чи мій комп high end і скільки токенів в секунду видасть. Але якщо там рівень о3, то страшно уявити що ж там буде в gpt-5 якщо локальну модельку вийшло так гарно стиснути і отримати такі результати

Хочу протестити.

А, до речі, вийшов Claude Opus 4.1, але про це мало написали, просто що він трохи краще пише код)

Ну і добре, бо це мій щоденний помічник тепер


https://openai.com/index/introducing-gpt-oss/
https://www.anthropic.com/news/claude-opus-4-1
2121
Бенчмарки
ШОК! Запустити локальну LLM-ку коштує дорожче ніж купляти по API?

Claude Code допоміг мені орендувати сервер з RTX 5080 на vast.ai, захостити gpt-oss і я отримав відповідь! І швидкість 25 токенів в секунду - досить непоганий результат, наче?

Ага, це здається що мій перший успішний запуск локальної ллмки.

Ціна сервера = $0.186 за годину)
Виходить, що ціна за 1 мільйон токенів = 2$, що є відносно дорого. І повільно.

Але, можна ж робити паралельні виклики, може тоді буде дешевше? Не знаю) Хто запускав вже локальні ллмки - пишіть в коментарях)
21
Як вам дизайн від GPT5?)
Якщо GPT5 не пофіксить казино в Селестії, то я навіть не знаю навіщо нею користуватися...


UPD. Не допоміг 😐

UPD 2. Claude Opus 4.1 допоміг:)
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Вау, це прикольно.
4
GPT-5 vs Claude 4.1 Opus 😜
3
Vibecoding Haven (BotfatherDEV)
Photo
В @AI_Celestia_bot до речі GPT5 вже доступний)

Як спробувати безкоштовно:
/provider_openai

І задаємо питання:
/helpful ваше питання
1
💡 GPT-5: дешева

Коротко: GPT-5 нарешті тут — і це не просто апгрейд, а модель, яку справді хочеться юзати. Головна фішка для нас: дешевша ціна за користь, яка на виході.

⚡️ Скільки це коштує насправді?
gpt-5$1.25 за 1М вхідних і $10 за 1М вихідних токенів. gpt-5-mini — $0.25 / $2, gpt-5-nano — $0.05 / $0.40. Це офіційні тарифи на день релізу.
• Порівняння з gpt-4o: залежно від версії, було $2.5–$5 in і $10–$15 out за 1М; отже за вхідні токени GPT-5 дешевший, а за вихідні — на рівні або дешевший
• Проти Claude Opus 4.1: $15 in / $75 out → GPT-5 виходить ~у 7.5 разів дешевший за вихідні токени. Якщо ціна — ключ, аргумент жирнючий.

🧠 Менше токенів на виході = реальна економія
Ключова зміна: GPT-5 із reasoning дає кращі відповіді, витрачаючи на 50–80% менше вихідних токенів, ніж наприклад Gemini 2.5 Pro. Тобто ви платите менше через стисліші відповіді.

• Лайфхак: в API з’явився параметр verbosity і «minimal reasoning». Для коротких задач ставте verbosity: "short" — і бюджет дякуватиме


🧷 Стабільність і поведінка в чаті
З мого боку за цей ранок — майже жодних обривів «думання», на відміну від того, як інколи поводився Gemini на довших запитах. А от Grok, як і раніше, іноді дуже довго думає, щоб сказати просту річ. Це суб’єктивно, але відчувається різниця. У вас так само, чи я занадто прискіпливий? 🙂


📚 Де вона краще «заходить»?
Тексти і резюме — стиль став акуратніший, менше пустих реверансів, краще тримає тон і структуру. OpenAI прямо каже, що «підправили підлабузництво» і стиль — і це чути
Код і агенти — норм для фронту/інтеграцій і «ланцюжків» з інструментами. Плюс GPT-5 тепер дефолт у ChatGPT (o3/4o відправили на пенсію), а якщо треба глибше — можна увімкнути «Thinking». В інтерфейсі навіть підказують: напишіть think hard about this, якщо хочете гарантовано більше reasoning.
Вартість/якість у більшості кейсів — беріть gpt-5 сміливо, а якщо важлива мінімальна ціна і швидкість, — gpt-5-mini / nano.

🛠 Швидкі поради
• Ставте verbosity:"short" і просіть «писати лаконічно»
• Для економії на дуже дуже простих задачах — gpt-5-mini, а якщо треба «на повну» — gpt-5.
• У чаті, коли треба більше глибини: напишіть прямо think hard about this.

🤨 Трошки скепсису не завадить
Так, навколо GPT-5 багато хайпу (занадто багато «безумовної любові» від блогерів в перші 24 години). Моя стратегія проста: порівнювати на своїх робочих кейсах, і якщо gpt-5 дає той самий результат, що й улюблений конкурент — але в рази дешевше — голосую гаманцем. А ви вже пробували? Де він у вас «вистрілив», а де — ні?

Напишіть у коменти, чи відчули ви різницю з ціною/стислістю — цікаво, що скаже ваша аналітика 💬

P.S. очевидно, що пост майже повністю написаний GPT-5 (з мого промпту і думок). Стилістика все ще гірше за Claude, але набагато краще ніж було в Openai раніше.
Please open Telegram to view this post
VIEW IN TELEGRAM
321
🎭 GPT-4o повернувся!

Пам'ятаєте, як всі скаржилися, що GPT-4o зник з селектора моделей? Ця моделька мала свій унікальний стиль написання - галюцинувала, але писала так душевно, що багатьом це подобалося більше ніж стерильні відповіді нових версій.

Мені особисто вона дуже не подобалася через те що вони дуже дурна і багато галюціонує. Але... Так

Що сталося сьогодні:

• GPT-5 розкатали на 100% користувачів (Plus, Pro, Team і навіть Free!)
• Подвоїли ліміти для Plus та Team на вихідні
• GPT-5 thinking та GPT-5 pro тепер прямо в основному селекторі моделей

Але найголовніше - GPT-4o таки повернули! 🎉

Правда, тепер його треба шукати в налаштуваннях:
1. Заходите в Settings на ChatGPT web
2. Вмикаєте "show legacy models"
3. Вуаля - ваша улюблена галюцинуюча моделька знову з вами

Цікава деталь про нові ліміти:

OpenAI пообіцяли, що коли ви вичерпаєте основний ліміт, автоматично підключаться міні-версії GPT-5 та GPT-5 thinking. Тобто ви не залишитесь без ШІ навіть після досягнення ліміту - просто перейдете на "молодших братів".

А ви помітили різницю між стилями моделей? Яка вам більше подобається для щоденних задач? 🤔
Тим часом, багато хто скаржиться на GPT5 у порівнянні з клодом. В принципі я погоджуюсь, але є деякі рідкісні кейси де він робить краще за Клод)

І знову таки. Ціна - головна його перевага. Якщо вам не впадлу зробити ще кілька запитів, то можна користуватися, але особисто мене це дратує і я залишусь на клоді

https://forum.cursor.com/t/gpt-5-is-really-bad-at-least-in-cursor/127157
21
1 мільйон токенів контекстне вікно на Claude Sonnet 4 😨😨😨😨😨🎉🎉🎉🎉🎉🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
5722