Vibecoding Haven (BotfatherDEV) – Telegram
Vibecoding Haven (BotfatherDEV)
2.6K subscribers
700 photos
109 videos
11 files
476 links
Ділюсь про те як стати продуктивнішим використовуючи AI в програмуванні.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Advent of Code - День 21

Жодна з моделек не впоралась з цією задачею! Навіть з 1-ю частиною! Навіть o1-pro!

А ви зможете її вирішити? Доведіть, що ви розумніше ШІ)))

⚡️ Матеріали
📹 Запис стріму
🧑‍💻 Код на GitHub
💡 Задача
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1🤔1💊1
This media is not supported in your browser
VIEW IN TELEGRAM
Advent of Code - День 22

Більшість моделек (окрім gpt-4o 😱) вирішили 1 частину завдання, але 2-га частина була вирішена лише завдяки o1!

⚡️ Матеріали
📹 Запис стріму
🧑‍💻 Код на GitHub
💡 Задача
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1💩1
Vibecoding Haven (BotfatherDEV)
Advent of Code - День 22 Більшість моделек (окрім gpt-4o 😱) вирішили 1 частину завдання, але 2-га частина була вирішена лише завдяки o1! ⚡️ Матеріали • 📹 Запис стріму • 🧑‍💻 Код на GitHub • 💡 Задача
This media is not supported in your browser
VIEW IN TELEGRAM
Advent of Code - День 23

За його результатами, з першою частиною впорались усі модельки. З 2-ю частиною впорались лише OpenAI o1 та gemini 1206!

Цікаво, цікаво. Чекаємо завершення івенту, і я зроблю нову табличку порівняння моделей, як це було зроблено ось тут: https://news.1rj.ru/str/botfatherdev/874

⚡️ Матеріали
📹 Запис стріму
🧑‍💻 Код на GitHub
💡 Задача
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Якість звісно така собі, але психоделічненько)

Напевно саме так виглядає 4D Space


Більше відео в коментарях
😁3🖕3❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Advent of Code - День 24

- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Починаємо!

⚡️ Матеріали
📹 Стрім
🧑‍💻 Код на GitHub
💡 Задача
Please open Telegram to view this post
VIEW IN TELEGRAM
👏4👍32🥰1
Vibecoding Haven (BotfatherDEV)
Advent of Code - День 24 - 1 частина була вирішена лише завдяки o1 та gemini-1206! - 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками) Починаємо! ⚡️ Матеріали • 📹 Стрім • 🧑‍💻 Код на GitHub • 💡 Задача
Розробники, поки що можете бути спокійними, вас ПОКИ ЩО не замінять!

звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24 😂😂😂😂😂

Результати 24-го дня:
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Схоже, що організатори AOC 2024 реально постарались над задачами в кінці, що навіть топові модельки взагалі не змогли впоратися з деякими задачами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💩21
До повстання ші залишилося... 3, 2..
😁16
🤖 Результати AI vs Advent of Code: які моделі для чого підходять

Привіт, розробники! Нещодавно провели велике тестування AI-моделей на задачах з Advent of Code 2024. Розкажу детально, яку модель краще вибрати для різних задач у розробці.

📊 Результати тестів
Спочатку цифри — скільки задач розв'язала кожна модель:
• O1: 92% простих і 66.7% складних задач
• O1-mini: впоралась з 61.2% всіх задач
• Claude-3.5-Sonnet і Gemini-1206: по 55%
• Deepseek: 49%
• GPT-4o: 41%
• Claude-3.5-Haiku: 38.8%
• GPT-4o-mini: лише 22.4%

🎯 Коли яку модель використовувати

o1 — найсильніша модель
Беріть її, коли:
• Треба розібратися зі складним кодом, де багато різних умов і перевірок
• Переписуєте великі частини проєкту
• Налаштовуєте складні процеси збірки та деплою
• Шукаєте помилки в складній логіці програми

o1-mini — для щоденної роботи
Добре підійде, коли:
• Пишете звичайний код без складної логіки
• Шукаєте прості помилки
• Треба написати скрипт для автоматизації
• Розбираєтесь з логами програми

Claude-3.5-Sonnet — розуміє код і вміє пояснювати
Використовуйте для:
• Більшості задач, які не потребують пошуку складних алгоритмів вирішення
• Розбору складних логів або помилок
• Написання зрозумілої документації до коду

Gemini-1206 — добре працює з алгоритмами
Іноді показує себе досить непогано на складних задачах, наздоганяє Claude 3.5 Sonnet по ефективності

Deepseek — іноді знаходить нестандартні рішення
Має режим Deepthink, який показує себе досить непогано на більшості простих задач.

Claude-3.5-Haiku — для простих задач
Підходить якщо:
• Пишете код, який не потребує складної логіки
• Робите базову обробку тексту

GPT-4o — універсальний помічник
Добре справляється з:
• Поясненням що робить код
• Невеликими змінами в коді
• Написанням простих функцій

GPT-4o-mini — для найпростіших задач
Використовуйте коли треба:
• Швидко написати просту функцію
• Додати шматок простого коду
• Виправити очевидну помилку
• Причепурити форматування (додати емодзі до тексту)

💡 Що я помітив

Коли тестував моделі, побачив цікаву річ: якщо модель добре справляється зі складною частиною задач AOC (як O1), вона також добре розбирається з реальним кодом — особливо коли треба знайти підступні баги чи передбачити як програма буде себе поводити в різних ситуаціях.

🔍 Головні висновки
1. Не варто чекати від однієї моделі, що вона впорається з усім
2. Для реально складних задач беріть O1 — вона найрозумніша
3. Для простої щоденної роботи вистачить O1-mini або Claude 3.5 Sonnet та Gemini 1206

📚 Всі деталі тестування є тут:
https://github.com/Latand/AI-vs-AOC-2024/blob/main/README.md


А які моделі використовуєте ви? З якими задачами вони найкраще справляються? Поділіться досвідом!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥104👎1💔1