NEW BOT Телеграм, страница - 276913824

Vibecoding Haven (BotfatherDEV)

2.6K subscribers

700 photos

109 videos

11 files

476 links

Ділюсь про те як стати продуктивнішим використовуючи AI в програмуванні.

Download Telegram

About

Blog

Apps

Platform

Vibecoding Haven (BotfatherDEV)

2.6K subscribers

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code - День 21

Жодна з моделек не впоралась з цією задачею! Навіть з 1-ю частиною! Навіть o1-pro!

А ви зможете її вирішити? Доведіть, що ви розумніше ШІ)))

⚡️

Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥1🤔1💊1

915 viewsedited 10:42

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code - День 22

Більшість моделек (окрім gpt-4o 😱) вирішили 1 частину завдання, але 2-га частина була вирішена лише завдяки o1!

⚡️

Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥1💩1

916 viewsedited 11:22

Vibecoding Haven (BotfatherDEV)

Vibecoding Haven (BotfatherDEV)

Advent of Code - День 22 Більшість моделек (окрім gpt-4o 😱) вирішили 1 частину завдання, але 2-га частина була вирішена лише завдяки o1! ⚡️ Матеріали • 📹 Запис стріму • 🧑‍💻 Код на GitHub • 💡 Задача

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code - День 23

За його результатами, з першою частиною впорались усі модельки. З 2-ю частиною впорались лише OpenAI o1 та gemini 1206!

Цікаво, цікаво. Чекаємо завершення івенту, і я зроблю нову табличку порівняння моделей, як це було зроблено ось тут: https://news.1rj.ru/str/botfatherdev/874

⚡️

Матеріали
• 📹 Запис стріму
• 🧑‍💻 Код на GitHub
• 💡 Задача

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥1

1.07K viewsedited 11:59

Vibecoding Haven (BotfatherDEV)

Vibecoding Haven (BotfatherDEV)

Advent of Code - День 23 За його результатами, з першою частиною впорались усі модельки. З 2-ю частиною впорались лише OpenAI o1 та gemini 1206! Цікаво, цікаво. Чекаємо завершення івенту, і я зроблю нову табличку порівняння моделей, як це було зроблено…

Згенерив відео про суть завдання з Sora.com для сьогоднішніх завдань) Наче прикольно вийшло :D

🤩2❤‍🔥1🖕1

1.03K views12:28

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

А ось власне і вони (останні 9 задач)

Day 15: Warehouse Woes
Day 16: Reindeer Maze
Day 17: Chronospatial Computer
Day 18: RAM Run
Day 19: Linen Layout
Day 20: Race Condition
Day 21: Keypad Conundrum
Day 22: Monkey Market
Day 23: LAN Party

❤2❤‍🔥2🤡1

1.33K views12:49

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Якість звісно така собі, але психоделічненько)

Напевно саме так виглядає 4D Space

Більше відео в коментарях

😁3🖕3❤‍🔥1

1.55K viewsedited 12:59

Vibecoding Haven (BotfatherDEV)

This media is not supported in your browser

VIEW IN TELEGRAM

Advent of Code - День 24

- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Починаємо!

⚡️

Матеріали
• 📹 Стрім
• 🧑‍💻 Код на GitHub
• 💡 Задача

Please open Telegram to view this post

VIEW IN TELEGRAM

👏4👍3❤2🥰1

1.8K viewsedited 08:14

Vibecoding Haven (BotfatherDEV)

Vibecoding Haven (BotfatherDEV)

Advent of Code - День 24 - 1 частина була вирішена лише завдяки o1 та gemini-1206! - 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками) Починаємо! ⚡️ Матеріали • 📹 Стрім • 🧑‍💻 Код на GitHub • 💡 Задача

Розробники, поки що можете бути спокійними, вас ПОКИ ЩО не замінять!

звісно, лише якщо ви здатні самостійно вирішити дні: 15, 17, 21, 24 😂😂😂😂😂

Результати 24-го дня:
- 1 частина була вирішена лише завдяки o1 та gemini-1206!
- 2 частину жодна з моделек не вирішила! (навіть o1-pro з підказками)

Схоже, що організатори AOC 2024 реально постарались над задачами в кінці, що навіть топові модельки взагалі не змогли впоратися з деякими задачами.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3💩2❤1

2.11K viewsedited 10:05

Vibecoding Haven (BotfatherDEV)

До повстання ші залишилося... 3, 2..

😁16

2.03K views17:46

Vibecoding Haven (BotfatherDEV)

Починаємо останній 25й день!
https://youtube.com/live/VkbSJ7B7s-o?feature=share

А ще, вітаю всіх віруючих з Різдвом 🎄

Please open Telegram to view this post

VIEW IN TELEGRAM

Day 25: Code Chronicle | Advent of Code 2024 | When AI Fails

Welcome to the Advent of Code 2024, where we're testing the problem-solving abilities of large language models (LLMs) in a cutting-edge programming environment: Cursor IDE, an AI-integrated development environment designed to enhance coding efficiency.

🤡2❤1

2.53K views11:25

Vibecoding Haven (BotfatherDEV)

🤖

Результати AI vs Advent of Code: які моделі для чого підходять

Привіт, розробники! Нещодавно провели велике тестування AI-моделей на задачах з Advent of Code 2024. Розкажу детально, яку модель краще вибрати для різних задач у розробці.

📊

Результати тестів
Спочатку цифри — скільки задач розв'язала кожна модель:
• O1: 92% простих і 66.7% складних задач
• O1-mini: впоралась з 61.2% всіх задач
• Claude-3.5-Sonnet і Gemini-1206: по 55%
• Deepseek: 49%
• GPT-4o: 41%
• Claude-3.5-Haiku: 38.8%
• GPT-4o-mini: лише 22.4%

🎯 Коли яку модель використовувати

⏭

o1 — найсильніша модель
Беріть її, коли:
• Треба розібратися зі складним кодом, де багато різних умов і перевірок
• Переписуєте великі частини проєкту
• Налаштовуєте складні процеси збірки та деплою
• Шукаєте помилки в складній логіці програми

⏭

o1-mini — для щоденної роботи
Добре підійде, коли:
• Пишете звичайний код без складної логіки
• Шукаєте прості помилки
• Треба написати скрипт для автоматизації
• Розбираєтесь з логами програми

⏭

Claude-3.5-Sonnet — розуміє код і вміє пояснювати
Використовуйте для:
• Більшості задач, які не потребують пошуку складних алгоритмів вирішення
• Розбору складних логів або помилок
• Написання зрозумілої документації до коду

⏭

Gemini-1206 — добре працює з алгоритмами
Іноді показує себе досить непогано на складних задачах, наздоганяє Claude 3.5 Sonnet по ефективності

⏭

Deepseek — іноді знаходить нестандартні рішення
Має режим Deepthink, який показує себе досить непогано на більшості простих задач.

⏭

Claude-3.5-Haiku — для простих задач
Підходить якщо:
• Пишете код, який не потребує складної логіки
• Робите базову обробку тексту

⏭

GPT-4o — універсальний помічник
Добре справляється з:
• Поясненням що робить код
• Невеликими змінами в коді
• Написанням простих функцій

⏭

GPT-4o-mini — для найпростіших задач
Використовуйте коли треба:
• Швидко написати просту функцію
• Додати шматок простого коду
• Виправити очевидну помилку
• Причепурити форматування (додати емодзі до тексту)

💡

Що я помітив

Коли тестував моделі, побачив цікаву річ: якщо модель добре справляється зі складною частиною задач AOC (як O1), вона також добре розбирається з реальним кодом — особливо коли треба знайти підступні баги чи передбачити як програма буде себе поводити в різних ситуаціях.

🔍

Головні висновки
1. Не варто чекати від однієї моделі, що вона впорається з усім
2. Для реально складних задач беріть O1 — вона найрозумніша
3. Для простої щоденної роботи вистачить O1-mini або Claude 3.5 Sonnet та Gemini 1206

📚 Всі деталі тестування є тут:

https://github.com/Latand/AI-vs-AOC-2024/blob/main/README.md

А які моделі використовуєте ви? З якими задачами вони найкраще справляються? Поділіться досвідом!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥10❤4👎1💔1

5.3K views15:25