ШОК! Запустити локальну LLM-ку коштує дорожче ніж купляти по API?
Claude Code допоміг мені орендувати сервер з RTX 5080 на vast.ai, захостити gpt-oss і я отримав відповідь! І швидкість 25 токенів в секунду - досить непоганий результат, наче?
Ага, це здається що мій перший успішний запуск локальної ллмки.
Ціна сервера = $0.186 за годину)
Виходить, що ціна за 1 мільйон токенів = 2$, що є відносно дорого. І повільно.
Але, можна ж робити паралельні виклики, може тоді буде дешевше? Не знаю) Хто запускав вже локальні ллмки - пишіть в коментарях)
Claude Code допоміг мені орендувати сервер з RTX 5080 на vast.ai, захостити gpt-oss і я отримав відповідь! І швидкість 25 токенів в секунду - досить непоганий результат, наче?
Ага, це здається що мій перший успішний запуск локальної ллмки.
Ціна сервера = $0.186 за годину)
Виходить, що ціна за 1 мільйон токенів = 2$, що є відносно дорого. І повільно.
Але, можна ж робити паралельні виклики, може тоді буде дешевше? Не знаю) Хто запускав вже локальні ллмки - пишіть в коментарях)
Якщо GPT5 не пофіксить казино в Селестії, то я навіть не знаю навіщо нею користуватися...
UPD. Не допоміг😐
UPD 2. Claude Opus 4.1 допоміг:)
UPD. Не допоміг
UPD 2. Claude Opus 4.1 допоміг:)
Please open Telegram to view this post
VIEW IN TELEGRAM
Vibecoding Haven (BotfatherDEV)
Photo
В @AI_Celestia_bot до речі GPT5 вже доступний)
Як спробувати безкоштовно:
/provider_openai
І задаємо питання:
Як спробувати безкоштовно:
/provider_openai
І задаємо питання:
/helpful ваше питання
Коротко: GPT-5 нарешті тут — і це не просто апгрейд, а модель, яку справді хочеться юзати. Головна фішка для нас: дешевша ціна за користь, яка на виході.
•
gpt-5 — $1.25 за 1М вхідних і $10 за 1М вихідних токенів. gpt-5-mini — $0.25 / $2, gpt-5-nano — $0.05 / $0.40. Це офіційні тарифи на день релізу.• Порівняння з
gpt-4o: залежно від версії, було $2.5–$5 in і $10–$15 out за 1М; отже за вхідні токени GPT-5 дешевший, а за вихідні — на рівні або дешевший• Проти
Claude Opus 4.1: $15 in / $75 out → GPT-5 виходить ~у 7.5 разів дешевший за вихідні токени. Якщо ціна — ключ, аргумент жирнючий.Ключова зміна: GPT-5 із reasoning дає кращі відповіді, витрачаючи на 50–80% менше вихідних токенів, ніж наприклад Gemini 2.5 Pro. Тобто ви платите менше через стисліші відповіді.
• Лайфхак: в API з’явився параметр
verbosity і «minimal reasoning». Для коротких задач ставте verbosity: "short" — і бюджет дякуватиме🧷 Стабільність і поведінка в чаті
З мого боку за цей ранок — майже жодних обривів «думання», на відміну від того, як інколи поводився Gemini на довших запитах. А от Grok, як і раніше, іноді дуже довго думає, щоб сказати просту річ. Це суб’єктивно, але відчувається різниця. У вас так само, чи я занадто прискіпливий? 🙂
• Тексти і резюме — стиль став акуратніший, менше пустих реверансів, краще тримає тон і структуру. OpenAI прямо каже, що «підправили підлабузництво» і стиль — і це чути
• Код і агенти — норм для фронту/інтеграцій і «ланцюжків» з інструментами. Плюс GPT-5 тепер дефолт у ChatGPT (o3/4o відправили на пенсію), а якщо треба глибше — можна увімкнути «Thinking». В інтерфейсі навіть підказують: напишіть
think hard about this, якщо хочете гарантовано більше reasoning.• Вартість/якість у більшості кейсів — беріть
gpt-5 сміливо, а якщо важлива мінімальна ціна і швидкість, — gpt-5-mini / nano. • Ставте
verbosity:"short" і просіть «писати лаконічно»• Для економії на дуже дуже простих задачах —
gpt-5-mini, а якщо треба «на повну» — gpt-5.• У чаті, коли треба більше глибини: напишіть прямо
think hard about this. Так, навколо GPT-5 багато хайпу (занадто багато «безумовної любові» від блогерів в перші 24 години). Моя стратегія проста: порівнювати на своїх робочих кейсах, і якщо
gpt-5 дає той самий результат, що й улюблений конкурент — але в рази дешевше — голосую гаманцем. А ви вже пробували? Де він у вас «вистрілив», а де — ні?Напишіть у коменти, чи відчули ви різницю з ціною/стислістю — цікаво, що скаже ваша аналітика 💬
P.S. очевидно, що пост майже повністю написаний GPT-5 (
Please open Telegram to view this post
VIEW IN TELEGRAM
🎭 GPT-4o повернувся!
Пам'ятаєте, як всі скаржилися, що GPT-4o зник з селектора моделей? Ця моделька мала свій унікальний стиль написання - галюцинувала, але писала так душевно, що багатьом це подобалося більше ніж стерильні відповіді нових версій.
Мені особисто вона дуже не подобалася через те що вони дуже дурна і багато галюціонує. Але... Так
Що сталося сьогодні:
• GPT-5 розкатали на 100% користувачів (Plus, Pro, Team і навіть Free!)
• Подвоїли ліміти для Plus та Team на вихідні
• GPT-5 thinking та GPT-5 pro тепер прямо в основному селекторі моделей
Але найголовніше - GPT-4o таки повернули! 🎉
Правда, тепер його треба шукати в налаштуваннях:
1. Заходите в Settings на ChatGPT web
2. Вмикаєте "show legacy models"
3. Вуаля - ваша улюблена галюцинуюча моделька знову з вами
Цікава деталь про нові ліміти:
OpenAI пообіцяли, що коли ви вичерпаєте основний ліміт, автоматично підключаться міні-версії GPT-5 та GPT-5 thinking. Тобто ви не залишитесь без ШІ навіть після досягнення ліміту - просто перейдете на "молодших братів".
А ви помітили різницю між стилями моделей? Яка вам більше подобається для щоденних задач? 🤔
Пам'ятаєте, як всі скаржилися, що GPT-4o зник з селектора моделей? Ця моделька мала свій унікальний стиль написання - галюцинувала, але писала так душевно, що багатьом це подобалося більше ніж стерильні відповіді нових версій.
Мені особисто вона дуже не подобалася через те що вони дуже дурна і багато галюціонує. Але... Так
Що сталося сьогодні:
• GPT-5 розкатали на 100% користувачів (Plus, Pro, Team і навіть Free!)
• Подвоїли ліміти для Plus та Team на вихідні
• GPT-5 thinking та GPT-5 pro тепер прямо в основному селекторі моделей
Але найголовніше - GPT-4o таки повернули! 🎉
Правда, тепер його треба шукати в налаштуваннях:
1. Заходите в Settings на ChatGPT web
2. Вмикаєте "show legacy models"
3. Вуаля - ваша улюблена галюцинуюча моделька знову з вами
Цікава деталь про нові ліміти:
OpenAI пообіцяли, що коли ви вичерпаєте основний ліміт, автоматично підключаться міні-версії GPT-5 та GPT-5 thinking. Тобто ви не залишитесь без ШІ навіть після досягнення ліміту - просто перейдете на "молодших братів".
А ви помітили різницю між стилями моделей? Яка вам більше подобається для щоденних задач? 🤔
Тим часом, багато хто скаржиться на GPT5 у порівнянні з клодом. В принципі я погоджуюсь, але є деякі рідкісні кейси де він робить краще за Клод)
І знову таки. Ціна - головна його перевага. Якщо вам не впадлу зробити ще кілька запитів, то можна користуватися, але особисто мене це дратує і я залишусь на клоді
https://forum.cursor.com/t/gpt-5-is-really-bad-at-least-in-cursor/127157
І знову таки. Ціна - головна його перевага. Якщо вам не впадлу зробити ще кілька запитів, то можна користуватися, але особисто мене це дратує і я залишусь на клоді
https://forum.cursor.com/t/gpt-5-is-really-bad-at-least-in-cursor/127157
Cursor - Community Forum
GPT 5 is really bad (at least in Cursor)
I don’t know if its Cursor or GPT-5, but my experience with GPT-5 so far has been very underwhelming. It makes weird choices, doesn’t remember or follow instructions well, and the code it writes hasn’t been great. The worst part is that its so darn slow!…
Please open Telegram to view this post
VIEW IN TELEGRAM
5 7 2 2
Vibecoding Haven (BotfatherDEV)
1 мільйон токенів контекстне вікно на Claude Sonnet 4 😨 😨 😨 😨 😨 🎉 🎉 🎉 🎉 🎉 🎉
На жаль, це поки що лише в апі, і лише для Tier 4, тобто ймовірно в Claude Code (поки що) недоступно по підписці.
Але чекаємо)
https://www.anthropic.com/news/1m-context
Але чекаємо)
https://www.anthropic.com/news/1m-context
Статистика натякає, що з репостами у нас сумно, а підписники потроху розбігаються по своїх справах
Якщо пости тут вам заходять - не соромтесь іноді поділитись з тими, кому це може бути корисно. Репост не кусається)
Дякую)
Якщо пости тут вам заходять - не соромтесь іноді поділитись з тими, кому це може бути корисно. Репост не кусається)
Дякую)
1 14 1
Vibecoding Haven (BotfatherDEV)
Розробники, поки що можете бути спокійними, вас ПОКИ ЩО не замінять! звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24 😂 😂 😂 😂 😂 Результати 24-го дня: - 1 частина була вирішена лише завдяки o1 та gemini-1206! - 2 частину жодна з моделек не…
GPT-5 Pro вирішив під час вирішення цієї задачі з Advent of Code передивиться відео на Youtube ???
Про шкоду куріння?
🤔 🤔 🤔 🤔 🤔
Про шкоду куріння?
Please open Telegram to view this post
VIEW IN TELEGRAM
1 12 8 1 1
Прогрес! GPT-5 Pro зміг впоратися і вирішити цю НАЙСКЛАДНІШУ ЗАДАЧУ, з якою, нагадую, не впоралася ЖОДНА нейронка кінця 2024 року.
Йому знадобилося аж 10 хвилин для цього!
Після цього я спробував Claude 4.1 Opus, і що ви думаєте? Клод думав протягом 2х хвилин і...ВІН ТЕЖ НАПИСАВ ПРАВИЛЬНИЙ КОД!
Треба враховувати, що GPT-5 Pro має доступ до інтернета і ймовірно (окрім відео про куріння) міг підгледіти рішення інших людей, тому я на 100% не впевнений чи це його заслуга.
Але факт залишається фактом, нарешті ця задача була вирішена ШІ!
🔗 Код: https://gist.github.com/Latand/626698a0d249beb463bd4baff1981430
Йому знадобилося аж 10 хвилин для цього!
Після цього я спробував Claude 4.1 Opus, і що ви думаєте? Клод думав протягом 2х хвилин і...
Треба враховувати, що GPT-5 Pro має доступ до інтернета і ймовірно (окрім відео про куріння) міг підгледіти рішення інших людей, тому я на 100% не впевнений чи це його заслуга.
Але факт залишається фактом, нарешті ця задача була вирішена ШІ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1 2 1 1