NEW BOT Телеграм, страница

Vibecoding Haven (BotfatherDEV)

Advent of Code - День 23 За його результатами, з першою частиною впорались усі модельки. З 2-ю частиною впорались лише OpenAI o1 та gemini 1206! Цікаво, цікаво. Чекаємо завершення івенту, і я зроблю нову табличку порівняння моделей, як це було зроблено…

Згенерив відео про суть завдання з Sora.com для сьогоднішніх завдань) Наче прикольно вийшло :D

🤩2❤‍🔥1🖕1

1.03K views12:28

Vibecoding Haven (BotfatherDEV)

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

А ось власне і вони (останні 9 задач)

Day 15: Warehouse Woes
Day 16: Reindeer Maze
Day 17: Chronospatial Computer
Day 18: RAM Run
Day 19: Linen Layout
Day 20: Race Condition
Day 21: Keypad Conundrum
Day 22: Monkey Market
Day 23: LAN Party

❤2❤‍🔥2🤡1

1.33K views12:49

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Якість звісно така собі, але психоделічненько)

Напевно саме так виглядає 4D Space

Більше відео в коментарях

😁3🖕3❤‍🔥1

1.55K viewsedited 12:59

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code - День 24

- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Починаємо!

⚡️

Матеріали
• 📹 Стрім
• 🧑‍💻 Код на GitHub
• 💡 Задача

Please open Telegram to view this post

VIEW IN TELEGRAM

👏4👍3❤2🥰1

1.8K viewsedited 08:14

Vibecoding Haven (BotfatherDEV)

Advent of Code - День 24 - 1 частина була вирішена лише завдяки o1 та gemini-1206! - 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками) Починаємо! ⚡️ Матеріали • 📹 Стрім • 🧑‍💻 Код на GitHub • 💡 Задача

Розробники, поки що можете бути спокійними, вас ПОКИ ЩО не замінять!

звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24 😂😂😂😂😂

Результати 24-го дня:
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Схоже, що організатори AOC 2024 реально постарались над задачами в кінці, що навіть топові модельки взагалі не змогли впоратися з деякими задачами.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3💩2❤1

2.11K viewsedited 10:05

Vibecoding Haven (BotfatherDEV)

До повстання ші залишилося... 3, 2..

😁16

2.03K views17:46

Vibecoding Haven (BotfatherDEV)

Починаємо останній 25й день!
https://youtube.com/live/VkbSJ7B7s-o?feature=share

А ще, вітаю всіх віруючих з Різдвом 🎄

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Day 25: Code Chronicle | Advent of Code 2024 | When AI Fails

Welcome to the Advent of Code 2024, where we're testing the problem-solving abilities of large language models (LLMs) in a cutting-edge programming environment: Cursor IDE, an AI-integrated development environment designed to enhance coding efficiency.

🤡2❤1

2.53K views11:25

Vibecoding Haven (BotfatherDEV)

🤖

Результати AI vs Advent of Code: які моделі для чого підходять

Привіт, розробники! Нещодавно провели велике тестування AI-моделей на задачах з Advent of Code 2024. Розкажу детально, яку модель краще вибрати для різних задач у розробці.

📊

Результати тестів
Спочатку цифри — скільки задач розв'язала кожна модель:
• O1: 92% простих і 66.7% складних задач
• O1-mini: впоралась з 61.2% всіх задач
• Claude-3.5-Sonnet і Gemini-1206: по 55%
• Deepseek: 49%
• GPT-4o: 41%
• Claude-3.5-Haiku: 38.8%
• GPT-4o-mini: лише 22.4%

🎯 Коли яку модель використовувати

⏭

o1 — найсильніша модель
Беріть її, коли:
• Треба розібратися зі складним кодом, де багато різних умов і перевірок
• Переписуєте великі частини проєкту
• Налаштовуєте складні процеси збірки та деплою
• Шукаєте помилки в складній логіці програми

⏭

o1-mini — для щоденної роботи
Добре підійде, коли:
• Пишете звичайний код без складної логіки
• Шукаєте прості помилки
• Треба написати скрипт для автоматизації
• Розбираєтесь з логами програми

⏭

Claude-3.5-Sonnet — розуміє код і вміє пояснювати
Використовуйте для:
• Більшості задач, які не потребують пошуку складних алгоритмів вирішення
• Розбору складних логів або помилок
• Написання зрозумілої документації до коду

⏭

Gemini-1206 — добре працює з алгоритмами
Іноді показує себе досить непогано на складних задачах, наздоганяє Claude 3.5 Sonnet по ефективності

⏭

Deepseek — іноді знаходить нестандартні рішення
Має режим Deepthink, який показує себе досить непогано на більшості простих задач.

⏭

Claude-3.5-Haiku — для простих задач
Підходить якщо:
• Пишете код, який не потребує складної логіки
• Робите базову обробку тексту

⏭

GPT-4o — універсальний помічник
Добре справляється з:
• Поясненням що робить код
• Невеликими змінами в коді
• Написанням простих функцій

⏭

GPT-4o-mini — для найпростіших задач
Використовуйте коли треба:
• Швидко написати просту функцію
• Додати шматок простого коду
• Виправити очевидну помилку
• Причепурити форматування (додати емодзі до тексту)

💡

Що я помітив

Коли тестував моделі, побачив цікаву річ: якщо модель добре справляється зі складною частиною задач AOC (як O1), вона також добре розбирається з реальним кодом — особливо коли треба знайти підступні баги чи передбачити як програма буде себе поводити в різних ситуаціях.

🔍

Головні висновки
1. Не варто чекати від однієї моделі, що вона впорається з усім
2. Для реально складних задач беріть O1 — вона найрозумніша
3. Для простої щоденної роботи вистачить O1-mini або Claude 3.5 Sonnet та Gemini 1206

📚 Всі деталі тестування є тут: