NEW BOT Телеграм, страница

🎄 Advent of Code День 10: Пошук стежок

Суть завдання:
В першій частині маємо топографічну карту висот (0-9). Треба знайти всі можливі стежки, що починаються з висоти 0 і закінчуються на 9, піднімаючись рівно на 1 за крок. Для кожної початкової точки рахуємо, до скількох "дев'яток" можна дійти.

В другій частині для кожної початкової точки треба порахувати кількість унікальних маршрутів до кожної "дев'ятки".

🎯 Результати дня
• Новий підхід: спочатку тестуємо найсильнішу модель щоб відкрити обидві частини, потім всі інші моделі на 2х частинах відразу.
• o1-preview відмінно впорався з обома частинами
• Claude Haiku заплутався в частинах завдання
• GPT-4o, Claude Sonnet, o1-mini та Gemini-exp-1206 також впоралися з обома частинами
• GPT-4o-mini розв'язав тільки першу частину

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub

❤7👍1😁1

812 viewsedited 09:31

Vibecoding Haven (BotfatherDEV)

🎄 Advent of Code День 11: Плутонські камінці

Сьогоднішня задача здалася дуже простою — треба було просто застосувати правила трансформації чисел багато разів. Але в цьому і була пастка!

В першій частині треба зробити 25 ітерацій — і це працює швидко. Але в другій частині вже 75 ітерацій, і якщо використовувати той самий підхід — комп'ютер рахував би 12 днів!

🎯 Результати моделей
• O1-preview та O1-mini: успіх в обох частинах
• GPT-4o: впорався з обома частинами
• Claude 3.5 Sonnet: тільки перша частина
• Gemini 1206: тільки перша частина
• Claude Haiku та GPT-4o-mini: не впоралися

💡 В чому фішка?
Замість того, щоб постійно перераховувати одні й ті ж комбінації, можна їх запам'ятовувати (memoization):

def stone_count(k, n, memo):
    if n == 0:
        return 1
        
    key = (k, n)
    # Якщо вже рахували цю комбінацію — беремо готовий результат
    if key in memo:  
        return memo[key]
        
    # Інакше рахуємо і зберігаємо результат
    stones = calculate_new_stones(k)  # застосовуємо правила
    total = sum(stone_count(s, n-1, memo) for s in stones)
    memo[key] = total
    return total

І тепер замість 12 днів задача розв'язується за кілька секунд! 🚀

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥3👍2🤡1

1K views08:28

Vibecoding Haven (BotfatherDEV)

🚨 Цей день настав! ЖОДНА AI НЕ ЗМОГЛА РОЗВ'ЯЗАТИ ЦЮ ЗАДАЧУ!

Advent of Code День 12

Вперше за всі дні тестування AI-моделей ми зіткнулися з задачею, яку не змогла розв'язати ЖОДНА модель! І не просто не змогла, а ще і після декількох спроб і додаткових промптів!

🎯 Що сталося
• Перша частина про підрахунок периметру і площі ділянок саду — майже всі моделі впоралися
• Друга частина про підрахунок кількості сторін — повне фіаско всіх моделей
• Навіть з підказками з Reddit та додатковими уточненнями — нуль результату
• Тестували навіть китайську модель Deepseek — теж не допомогло

🤖 Результати тестування
• 7 з 8 моделей змогли розв'язати частину 1
• 0 з 8 моделей змогли розв'язати частину 2
• Додаткові підказки не допомогли
• Ручне виправлення коду теж не спрацювало

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub

⏱️ Таймкоди:
- 1:44 — Розбір першої частини
- 10:44 — O1-mini розв'язує ч.1
- 12:44 — Читаємо частину 2
- 15:40 — Тестуємо всі моделі
- 41:43 — Спроби з додатковими підказками
- 56:16 — Експеримент з Deepseek
- 1:02:06 — Спроба зрозуміти рішення з YouTube
- 1:19:43 — Пошук підказок на Reddit
- 1:24:34 — Останні спроби з підказками

👏5🤯4👍2❤1🔥1

986 viewsedited 09:56

Vibecoding Haven (BotfatherDEV)

🎄 Advent of Code День 13: Ігрові автомати

Суть завдання:
В першій частині треба розрахувати мінімальну кількість токенів для виграшу призів в автоматах. Кнопка A коштує 3 токени, B - 1 токен. Кожна кнопка рухає захват на певну відстань по X та Y.

В другій частині координати призів збільшуються на 10 трильйонів, що суттєво ускладнює розрахунки.

🎯 Цікаві результати

• Несподівано GPT-4o та Claude 3.5 Sonnet навіть не змогли правильно зчитати вхідні дані
• Gemini 1206, o1 та o1-mini показали найкращі результати
• Цікавий кейс: o1-mini зміг вирішити задачу, використовуючи план від o1

💡 Чому варто спробувати Gemini

До речі, про Gemini 1206, з яким я експериментував останні дні. Це дуже потужна модель, яка зараз безкоштовно доступна в AI Studio від Google (звісно, з певними лімітами якщо безкоштовно).
Вона має величезне контекстне вікно в 2 мільйони токенів, порівняно з 128K у GPT-4/o1 чи 200K у Claude Sonnet. Це дозволяє їй обробляти величезні документи, читати PDF з таблицями та графіками.

🔍

Цікаве про взаємодію моделей

Сьогодні побачили цікавий патерн: O1-mini зміг успішно написати код, використовуючи план від o1, хоча самостійно двічі не впорався із завданням. Схоже, це може бути корисною стратегією: використовувати o1 для глибокого планування, а потім передавати цей план o1-mini для написання коду. А далі можна покращувати код за допомогою Claude, який зазвичай пише більш читабельні рішення.

⚡️

Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤‍🔥2❤2🔥1👏1

907 viewsedited 08:48

Vibecoding Haven (BotfatherDEV)

Claude критикує OpenAI o1, коли він сьогодні видав мені таке "рішення" задачі:

В червоному прямокутнику написано:

"Оскільки ми знаємо з опису головоломки:
Частина 1 результат був даний як 31552.
Для Частини 2 ми знаємо, що відповідь інша і більша.
Ми повертаємо ці відомі/жорстко закодовані значення для демонстрації."

По суті, хтось схалтурив і просто вписав готові відповіді замість того, щоб розв'язувати задачу)))

👍6❤‍🔥1❤1🤡1

1.08K viewsedited 12:35

Vibecoding Haven (BotfatherDEV)

День 14: Починаємо стрім!

YouTube

Day 14: Restroom Redoubt | Advent of Code 2024 | When AI Fails

Welcome to the Advent of Code 2024, where we're testing the problem-solving abilities of large language models (LLMs) in a cutting-edge programming environment: Cursor IDE, an AI-integrated development environment designed to enhance coding efficiency.

🤡1

1.09K views12:37

Vibecoding Haven (BotfatherDEV)

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Результат сьогоднішнього дню:

👍5🎄4🤡1

1.08K viewsedited 14:09

Vibecoding Haven (BotfatherDEV)

🤖 AI: 5 хвилин замість 2 годин роботи

Щойно натрапив на цікавий твіт від розробника, який використав o1-pro для виконання 6 завдань зі свого todo-листа, і результати просто вражають!

📊 Вражаюча статистика

• o1-pro думав протягом 5 хвилин 25 секунд
• Змінено: 14 файлів проекту
• На вході: 64,852 вхідних токенів
• На виході: 14,740 вихідних токенів

Уявіть собі: завдання, яке зазвичай забирає 2 години робочого часу, було виконано за 5 хвилин. І не просто виконано, а зі 100% точністю!

1🤡1

1.22K views18:27

Vibecoding Haven (BotfatherDEV)

🤔 Режим Сократа (мудреця) і Gemini 2.0 Flash

Зробив невеличке оновлення @AI_Celestia_bot, яке дуже раджу спробувати всім.

Працює ось так: вводите /socrates, і бот входить в режим Сократа, в якому він буде намагатися допомогти вам краще зрозуміти свої думки, через питання і уточнення.

Приклад:
Ви в чомусь дуже впевнені, але вам не подобається, що деякі люди з вами не погоджуються на цьому питанні.
І замість того, щоб злитися на них, ви можете пояснити боту, чому саме ви так впевнені в своїй правоті. Бот допоможе вам подивитися на ситуацію з іншого боку, і можливо, ви знайдете спільну мову з тими, хто з вами не згоден. Або не знайдете, але хоча б краще зрозумієте свою позицію.

⚡️

Gemini
Додав в бота нового ШІ провайдера, який вмикається через /provider_gemini
Доступні модельки:
- Fast Mode: Gemini 2.0 Flash
- Smart Mode: Gemini 1206 Experimental | Gemini 1.5 Pro

Маю зауважити, що Gemini на диво ДУЖЕ класно імітує роль, яку їй описали, і я задоволений відповідями обидвох моделей.

Саме тому, тепер по дефолту в режимах /nasty та /regular - тепер вам буде відповідати не Claude 3.5 Haiku, а саме Gemini 2.0 Flash.

Спробуйте просто зараз в своїй групі @AI_Celestia_bot!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15❤‍🔥3😍3❤1🍓1

1.19K views11:16

Vibecoding Haven (BotfatherDEV)

Хочете доступ до o1-pro? Я дуже хочу.

✅ Неактуально, набрали необхідну кількість! Всім дякую)

😁7👍3🤡1

1.02K viewsedited 16:39

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code – День 15

Продовжуємо нашу подорож у AOC! Декілька окремих стрімів підряд допомогли розібрати першу частину задачі, але з другою частиною більшість моделей (навіть o1-pro!) не впорались.

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

❤1🤡1

783 viewsedited 09:49

Vibecoding Haven (BotfatherDEV)

Advent of Code – День 15 Продовжуємо нашу подорож у AOC! Декілька окремих стрімів підряд допомогли розібрати першу частину задачі, але з другою частиною більшість моделей (навіть o1-pro!) не впорались. ⚡️ Матеріали • 📹 Запис стріму • 🧑‍💻 Код на GitHub •…

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code – День 16

День 16 виявився легшим: кілька моделей (зокрема o1 та claude 3.5 sonnet) вирішили другу частину, хоча деякі навіть із першою частиною не впорались.

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

🤡1

733 viewsedited 10:50

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code – День 17

День 17 знову став викликом: не всі моделі змогли розв’язати навіть першу частину, а другу частину не подолала навіть o1-pro.

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

🤡1

778 viewsedited 11:17

Vibecoding Haven (BotfatherDEV)

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code – День 18

День 18 був дуже цікавим: o1-міні не впоралась із жодною задачею, тоді як claude 3.5 haiku, o1, claude 3.5 sonnet та gpt4o успішно розв’язали обидві частини.

⚡️ Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

🤡1

843 viewsedited 12:01

About

Blog

Apps

Platform