На LLM Arena насправді з'явилось нещодавно багато досить розумних моделек. Особисто мені сподобалися відповіді китайських minmax та qwen (великих).
Ну і по ціні вони звісно дешевше конкурентів
Ну і по ціні вони звісно дешевше конкурентів
Claude Code — потужна штука, але вона обмежена лише клодом, і не можна, наприклад, легко переключитися на іншу модельку потестити, типу horizon.
Саме тому зараз набирають популярність альтернативи, серед яких є і опенсурсні (значить можна ще і під себе змінювати). І там можна вибирати серед моделек.
Але поки вигідніше буде юзати клод по підписці — їм буде важко)
Саме тому зараз набирають популярність альтернативи, серед яких є і опенсурсні (значить можна ще і під себе змінювати). І там можна вибирати серед моделек.
Але поки вигідніше буде юзати клод по підписці — їм буде важко)
Github Actions + Claude Code = Claude Bot❤️
• тегаєм Claude-бота, поправити тест і go fmt.
• Бот відповідає «ок, гляну». З’являється коміт «Fix failing test and Go formatting».
• CI-джоби стартують:
– Go fmt ✅
– тести 491 / 491 ✅
Одним рядком: клод-бот підлатав і закомітив
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Vibecoding Haven (BotfatherDEV)
Github Actions + Claude Code = Claude Bot❤️ • тегаєм Claude-бота, поправити тест і go fmt. • Бот відповідає «ок, гляну». З’являється коміт «Fix failing test and Go formatting». • CI-джоби стартують: – Go fmt ✅ – тести 491 / 491 ✅ Одним рядком: клод…
Зворотня сторона 💀
(Це повний лог його розмови на гітхаб)
P.S. В мене підписка стоїть, тому наче я це не оплачую
(Це повний лог його розмови на гітхаб)
P.S. В мене підписка стоїть, тому наче я це не оплачую
Всі чекали GPT5, але вийшов gpt-oss, ЛОКАЛЬНА версія LLM, яка пишуть що на рівні OpenAI o3, а запустити можна локально на high-end pc
Дуже цікаво чи мій комп high end і скільки токенів в секунду видасть. Але якщо там рівень о3, то страшно уявити що ж там буде в gpt-5 якщо локальну модельку вийшло так гарно стиснути і отримати такі результати
Хочу протестити.
А, до речі, вийшов Claude Opus 4.1, але про це мало написали, просто що він трохи краще пише код)
Ну і добре, бо це мій щоденний помічник тепер
https://openai.com/index/introducing-gpt-oss/
https://www.anthropic.com/news/claude-opus-4-1
Дуже цікаво чи мій комп high end і скільки токенів в секунду видасть. Але якщо там рівень о3, то страшно уявити що ж там буде в gpt-5 якщо локальну модельку вийшло так гарно стиснути і отримати такі результати
Хочу протестити.
А, до речі, вийшов Claude Opus 4.1, але про це мало написали, просто що він трохи краще пише код)
Ну і добре, бо це мій щоденний помічник тепер
https://openai.com/index/introducing-gpt-oss/
https://www.anthropic.com/news/claude-opus-4-1
21 2 1
ШОК! Запустити локальну LLM-ку коштує дорожче ніж купляти по API?
Claude Code допоміг мені орендувати сервер з RTX 5080 на vast.ai, захостити gpt-oss і я отримав відповідь! І швидкість 25 токенів в секунду - досить непоганий результат, наче?
Ага, це здається що мій перший успішний запуск локальної ллмки.
Ціна сервера = $0.186 за годину)
Виходить, що ціна за 1 мільйон токенів = 2$, що є відносно дорого. І повільно.
Але, можна ж робити паралельні виклики, може тоді буде дешевше? Не знаю) Хто запускав вже локальні ллмки - пишіть в коментарях)
Claude Code допоміг мені орендувати сервер з RTX 5080 на vast.ai, захостити gpt-oss і я отримав відповідь! І швидкість 25 токенів в секунду - досить непоганий результат, наче?
Ага, це здається що мій перший успішний запуск локальної ллмки.
Ціна сервера = $0.186 за годину)
Виходить, що ціна за 1 мільйон токенів = 2$, що є відносно дорого. І повільно.
Але, можна ж робити паралельні виклики, може тоді буде дешевше? Не знаю) Хто запускав вже локальні ллмки - пишіть в коментарях)
Якщо GPT5 не пофіксить казино в Селестії, то я навіть не знаю навіщо нею користуватися...
UPD. Не допоміг😐
UPD 2. Claude Opus 4.1 допоміг:)
UPD. Не допоміг
UPD 2. Claude Opus 4.1 допоміг:)
Please open Telegram to view this post
VIEW IN TELEGRAM
Vibecoding Haven (BotfatherDEV)
Photo
В @AI_Celestia_bot до речі GPT5 вже доступний)
Як спробувати безкоштовно:
/provider_openai
І задаємо питання:
Як спробувати безкоштовно:
/provider_openai
І задаємо питання:
/helpful ваше питання
Коротко: GPT-5 нарешті тут — і це не просто апгрейд, а модель, яку справді хочеться юзати. Головна фішка для нас: дешевша ціна за користь, яка на виході.
•
gpt-5 — $1.25 за 1М вхідних і $10 за 1М вихідних токенів. gpt-5-mini — $0.25 / $2, gpt-5-nano — $0.05 / $0.40. Це офіційні тарифи на день релізу.• Порівняння з
gpt-4o: залежно від версії, було $2.5–$5 in і $10–$15 out за 1М; отже за вхідні токени GPT-5 дешевший, а за вихідні — на рівні або дешевший• Проти
Claude Opus 4.1: $15 in / $75 out → GPT-5 виходить ~у 7.5 разів дешевший за вихідні токени. Якщо ціна — ключ, аргумент жирнючий.Ключова зміна: GPT-5 із reasoning дає кращі відповіді, витрачаючи на 50–80% менше вихідних токенів, ніж наприклад Gemini 2.5 Pro. Тобто ви платите менше через стисліші відповіді.
• Лайфхак: в API з’явився параметр
verbosity і «minimal reasoning». Для коротких задач ставте verbosity: "short" — і бюджет дякуватиме🧷 Стабільність і поведінка в чаті
З мого боку за цей ранок — майже жодних обривів «думання», на відміну від того, як інколи поводився Gemini на довших запитах. А от Grok, як і раніше, іноді дуже довго думає, щоб сказати просту річ. Це суб’єктивно, але відчувається різниця. У вас так само, чи я занадто прискіпливий? 🙂
• Тексти і резюме — стиль став акуратніший, менше пустих реверансів, краще тримає тон і структуру. OpenAI прямо каже, що «підправили підлабузництво» і стиль — і це чути
• Код і агенти — норм для фронту/інтеграцій і «ланцюжків» з інструментами. Плюс GPT-5 тепер дефолт у ChatGPT (o3/4o відправили на пенсію), а якщо треба глибше — можна увімкнути «Thinking». В інтерфейсі навіть підказують: напишіть
think hard about this, якщо хочете гарантовано більше reasoning.• Вартість/якість у більшості кейсів — беріть
gpt-5 сміливо, а якщо важлива мінімальна ціна і швидкість, — gpt-5-mini / nano. • Ставте
verbosity:"short" і просіть «писати лаконічно»• Для економії на дуже дуже простих задачах —
gpt-5-mini, а якщо треба «на повну» — gpt-5.• У чаті, коли треба більше глибини: напишіть прямо
think hard about this. Так, навколо GPT-5 багато хайпу (занадто багато «безумовної любові» від блогерів в перші 24 години). Моя стратегія проста: порівнювати на своїх робочих кейсах, і якщо
gpt-5 дає той самий результат, що й улюблений конкурент — але в рази дешевше — голосую гаманцем. А ви вже пробували? Де він у вас «вистрілив», а де — ні?Напишіть у коменти, чи відчули ви різницю з ціною/стислістю — цікаво, що скаже ваша аналітика 💬
P.S. очевидно, що пост майже повністю написаний GPT-5 (
Please open Telegram to view this post
VIEW IN TELEGRAM
🎭 GPT-4o повернувся!
Пам'ятаєте, як всі скаржилися, що GPT-4o зник з селектора моделей? Ця моделька мала свій унікальний стиль написання - галюцинувала, але писала так душевно, що багатьом це подобалося більше ніж стерильні відповіді нових версій.
Мені особисто вона дуже не подобалася через те що вони дуже дурна і багато галюціонує. Але... Так
Що сталося сьогодні:
• GPT-5 розкатали на 100% користувачів (Plus, Pro, Team і навіть Free!)
• Подвоїли ліміти для Plus та Team на вихідні
• GPT-5 thinking та GPT-5 pro тепер прямо в основному селекторі моделей
Але найголовніше - GPT-4o таки повернули! 🎉
Правда, тепер його треба шукати в налаштуваннях:
1. Заходите в Settings на ChatGPT web
2. Вмикаєте "show legacy models"
3. Вуаля - ваша улюблена галюцинуюча моделька знову з вами
Цікава деталь про нові ліміти:
OpenAI пообіцяли, що коли ви вичерпаєте основний ліміт, автоматично підключаться міні-версії GPT-5 та GPT-5 thinking. Тобто ви не залишитесь без ШІ навіть після досягнення ліміту - просто перейдете на "молодших братів".
А ви помітили різницю між стилями моделей? Яка вам більше подобається для щоденних задач? 🤔
Пам'ятаєте, як всі скаржилися, що GPT-4o зник з селектора моделей? Ця моделька мала свій унікальний стиль написання - галюцинувала, але писала так душевно, що багатьом це подобалося більше ніж стерильні відповіді нових версій.
Мені особисто вона дуже не подобалася через те що вони дуже дурна і багато галюціонує. Але... Так
Що сталося сьогодні:
• GPT-5 розкатали на 100% користувачів (Plus, Pro, Team і навіть Free!)
• Подвоїли ліміти для Plus та Team на вихідні
• GPT-5 thinking та GPT-5 pro тепер прямо в основному селекторі моделей
Але найголовніше - GPT-4o таки повернули! 🎉
Правда, тепер його треба шукати в налаштуваннях:
1. Заходите в Settings на ChatGPT web
2. Вмикаєте "show legacy models"
3. Вуаля - ваша улюблена галюцинуюча моделька знову з вами
Цікава деталь про нові ліміти:
OpenAI пообіцяли, що коли ви вичерпаєте основний ліміт, автоматично підключаться міні-версії GPT-5 та GPT-5 thinking. Тобто ви не залишитесь без ШІ навіть після досягнення ліміту - просто перейдете на "молодших братів".
А ви помітили різницю між стилями моделей? Яка вам більше подобається для щоденних задач? 🤔
Тим часом, багато хто скаржиться на GPT5 у порівнянні з клодом. В принципі я погоджуюсь, але є деякі рідкісні кейси де він робить краще за Клод)
І знову таки. Ціна - головна його перевага. Якщо вам не впадлу зробити ще кілька запитів, то можна користуватися, але особисто мене це дратує і я залишусь на клоді
https://forum.cursor.com/t/gpt-5-is-really-bad-at-least-in-cursor/127157
І знову таки. Ціна - головна його перевага. Якщо вам не впадлу зробити ще кілька запитів, то можна користуватися, але особисто мене це дратує і я залишусь на клоді
https://forum.cursor.com/t/gpt-5-is-really-bad-at-least-in-cursor/127157
Cursor - Community Forum
GPT 5 is really bad (at least in Cursor)
I don’t know if its Cursor or GPT-5, but my experience with GPT-5 so far has been very underwhelming. It makes weird choices, doesn’t remember or follow instructions well, and the code it writes hasn’t been great. The worst part is that its so darn slow!…
Please open Telegram to view this post
VIEW IN TELEGRAM
5 7 2 2
Vibecoding Haven (BotfatherDEV)
1 мільйон токенів контекстне вікно на Claude Sonnet 4 😨 😨 😨 😨 😨 🎉 🎉 🎉 🎉 🎉 🎉
На жаль, це поки що лише в апі, і лише для Tier 4, тобто ймовірно в Claude Code (поки що) недоступно по підписці.
Але чекаємо)
https://www.anthropic.com/news/1m-context
Але чекаємо)
https://www.anthropic.com/news/1m-context