Vibecoding Haven (BotfatherDEV)
Advent of Code - День 23 За його результатами, з першою частиною впорались усі модельки. З 2-ю частиною впорались лише OpenAI o1 та gemini 1206! Цікаво, цікаво. Чекаємо завершення івенту, і я зроблю нову табличку порівняння моделей, як це було зроблено…
Згенерив відео про суть завдання з Sora.com для сьогоднішніх завдань) Наче прикольно вийшло :D
🤩2❤🔥1🖕1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
А ось власне і вони (останні 9 задач)
Day 15: Warehouse Woes
Day 16: Reindeer Maze
Day 17: Chronospatial Computer
Day 18: RAM Run
Day 19: Linen Layout
Day 20: Race Condition
Day 21: Keypad Conundrum
Day 22: Monkey Market
Day 23: LAN Party
Day 15: Warehouse Woes
Day 16: Reindeer Maze
Day 17: Chronospatial Computer
Day 18: RAM Run
Day 19: Linen Layout
Day 20: Race Condition
Day 21: Keypad Conundrum
Day 22: Monkey Market
Day 23: LAN Party
❤2❤🔥2🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Якість звісно така собі, але психоделічненько)
Напевно саме так виглядає 4D Space
Більше відео в коментарях
Напевно саме так виглядає 4D Space
Більше відео в коментарях
😁3🖕3❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Advent of Code - День 24
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)
Починаємо!
⚡️ Матеріали
• 📹 Стрім
• 🧑💻 Код на GitHub
• 💡 Задача
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)
Починаємо!
• 📹 Стрім
• 🧑💻 Код на GitHub
• 💡 Задача
Please open Telegram to view this post
VIEW IN TELEGRAM
👏4👍3❤2🥰1
Vibecoding Haven (BotfatherDEV)
Advent of Code - День 24 - 1 частина була вирішена лише завдяки o1 та gemini-1206! - 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками) Починаємо! ⚡️ Матеріали • 📹 Стрім • 🧑💻 Код на GitHub • 💡 Задача
Розробники, поки що можете бути спокійними, вас ПОКИ ЩО не замінять!
звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24😂 😂 😂 😂 😂
Результати 24-го дня:
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)
Схоже, що організатори AOC 2024 реально постарались над задачами в кінці, що навіть топові модельки взагалі не змогли впоратися з деякими задачами.
звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24
Результати 24-го дня:
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)
Схоже, що організатори AOC 2024 реально постарались над задачами в кінці, що навіть топові модельки взагалі не змогли впоратися з деякими задачами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💩2❤1
Починаємо останній 25й день!
https://youtube.com/live/VkbSJ7B7s-o?feature=share
https://youtube.com/live/VkbSJ7B7s-o?feature=share
А ще, вітаю всіх віруючих з Різдвом🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Day 25: Code Chronicle | Advent of Code 2024 | When AI Fails
Welcome to the Advent of Code 2024, where we're testing the problem-solving abilities of large language models (LLMs) in a cutting-edge programming environment: Cursor IDE, an AI-integrated development environment designed to enhance coding efficiency.
🤡2❤1
Привіт, розробники! Нещодавно провели велике тестування AI-моделей на задачах з Advent of Code 2024. Розкажу детально, яку модель краще вибрати для різних задач у розробці.
Спочатку цифри — скільки задач розв'язала кожна модель:
• O1: 92% простих і 66.7% складних задач
• O1-mini: впоралась з 61.2% всіх задач
• Claude-3.5-Sonnet і Gemini-1206: по 55%
• Deepseek: 49%
• GPT-4o: 41%
• Claude-3.5-Haiku: 38.8%
• GPT-4o-mini: лише 22.4%
🎯 Коли яку модель використовувати
Беріть її, коли:
• Треба розібратися зі складним кодом, де багато різних умов і перевірок
• Переписуєте великі частини проєкту
• Налаштовуєте складні процеси збірки та деплою
• Шукаєте помилки в складній логіці програми
Добре підійде, коли:
• Пишете звичайний код без складної логіки
• Шукаєте прості помилки
• Треба написати скрипт для автоматизації
• Розбираєтесь з логами програми
Використовуйте для:
• Більшості задач, які не потребують пошуку складних алгоритмів вирішення
• Розбору складних логів або помилок
• Написання зрозумілої документації до коду
Іноді показує себе досить непогано на складних задачах, наздоганяє Claude 3.5 Sonnet по ефективності
Має режим Deepthink, який показує себе досить непогано на більшості простих задач.
Підходить якщо:
• Пишете код, який не потребує складної логіки
• Робите базову обробку тексту
Добре справляється з:
• Поясненням що робить код
• Невеликими змінами в коді
• Написанням простих функцій
Використовуйте коли треба:
• Швидко написати просту функцію
• Додати шматок простого коду
• Виправити очевидну помилку
• Причепурити форматування (додати емодзі до тексту)
Коли тестував моделі, побачив цікаву річ: якщо модель добре справляється зі складною частиною задач AOC (як O1), вона також добре розбирається з реальним кодом — особливо коли треба знайти підступні баги чи передбачити як програма буде себе поводити в різних ситуаціях.
1. Не варто чекати від однієї моделі, що вона впорається з усім
2. Для реально складних задач беріть O1 — вона найрозумніша
3. Для простої щоденної роботи вистачить O1-mini або Claude 3.5 Sonnet та Gemini 1206
https://github.com/Latand/AI-vs-AOC-2024/blob/main/README.md
А які моделі використовуєте ви? З якими задачами вони найкраще справляються? Поділіться досвідом!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥10❤4👎1💔1
Forwarded from /g/‘s Tech Memes (Gianmarco Gargiulo)
❤2