Kyryl opens ML – Telegram
Сьогодні існує так багато способів створення агентів:

No-code, SDK, Chat UI! Схоже, що кожна велика компанія має свій власний підхід, фреймворк та інструменти, а нові з'являються щодня. Я підсумував свою думку на зображенні з усіма посиланнями в коментарях.

Цікаво, що ви використовуєте?
👍5
Супер крута фіча від Cognition - DeepWiki! Спробував його на репозиторії мого курсу і результати дуже крутий!

https://deepwiki.com/kyryl-opens-ml/ml-in-production-practice

Однозначно варто використовувати для будь-якого open source коду, який ви використовуєте, і як бонус - він має MCP!

https://docs.devin.ai/work-with-devin/deepwiki-mcp
3👍3
Cloud Run + GPU Zero scale = ❤️

Cloud Run тепер не лише має GPU, але й має можливість масштабування GPU до нуля! Чудовий варіант, якщо ви хочете самостійно хостити LLM не за всі гроші світу, враховуючи всі проблеми з конфіденційністю, IP та драму, що відбувається навколо.

Мій улюблений варіант - Modal, але, на жаль, не всі компанії його використовують - тому підтримка масштабування до нуля для GPU від GCP/AWS - це чудова новина!

- Cloud Run GPUs: https://cloud.google.com/blog/products/serverless/cloud-run-gpus-are-now-generally-available
- AWS: https://aws.amazon.com/blogs/machine-learning/unlock-cost-savings-with-the-new-scale-down-to-zero-feature-in-amazon-sagemaker-inference/
👍71
Як я використовую o3-pro
😁13👌1😨1
Нісенітниці про мультиагентні системи

Ковток свіжого повітря і викриття нісенітниць про мультиагентні системи.

https://cognition.ai/blog/dont-build-multi-agents

TLDR: використовуйте single-threaded агента для надійних застосунків!
👍5🔥2
Ось як виглядає сучасна розробка моделей:


- Єдина базова модель
- Кілька спеціалізованих адаптерів LoRA
- Подвійний вихід: один вектор для швидкості й multi-вектор для точності (підвищення продуктивності на 7–10 %)

Я був у захваті, коли з’явилася ColPali (чиста візуальна модель пошуку) - я навіть створив продукт на її основі: https://github.com/kyryl-opens-ml/no-ocr (не можу дочекатися оновлення до Jina 4).

Приємно бачити, як уніфікована система моделей перевершує ColPali у візуальному пошуку документів та інших завданнях пошуку.

Головний урок щодо даних: Curation beats collection.

Якщо ви працюєте з RAG або будь-яким процесом пошуку - обов’язково спробуйте цю модель!

https://jina.ai/news/jina-embeddings-v4-universal-embeddings-for-multimodal-multilingual-retrieval/
🔥10
AI coding agents need engineering guardrails

Неочевидний інсайт: чим більше дозволяєш AI писати код, тим БІЛЬШЕ треба дотримуватись інженерних практик, а не менше.

Чому? Бо AI генерує код з швидкістю 10x - а значить може наплодити технічного боргу зі швидкістю 100x.

Essential guardrails:

- Модульна архітектура -> зміни від AI залишаються локальними
- Купа тестів -> ловимо галюни AI
- Тимчасові прев'ю envs -> бачимо що AI реально набудував перед мерджем
- CI/CD пайплайни -> код від AI не попадає в прод без перевірки
- Нудний техстек -> у AI більше даних для тренування
- Спостережувані системи -> дебажимо "креативні" рішення AI

Парадокс: щоб ефективно юзати тули які "автоматизують" кодинг, треба бути ще крутішим інженером ніж раніше.
👍12🫡1
Відео-функція NotebookLM супер крута!

Щойно зробив з мого блог-посту відео-пояснення. Є деякі проблеми, але результат вражаючий з першого разу - https://www.youtube.com/watch?v=Y_Xj0FXdJ_A
🔥9
Cursor створює PR.
Railway піднімає live прев’ю для нього.
Я мерджу, коли все виглядає добре.
Ось і весь цикл - швидко, безпечно, повторювано.

Деталі: https://kyrylai.com/2025/08/04/cursor-railway-vibe-coding-pr-environments/
👍5🔥1
100% коду для цього графіка - від AI.

Без хайпу: реальні цифри. На простих задачах у проєктах з нуля +37.5%, на легасі +17.5%. На складних - скромно: +12.5% / +5%.

Дуже цікаві висновки: https://www.youtube.com/watch?v=tbDDYKRFjhk
👍2👏1
Generative UI - це, напевно, найбільш недооцінений реліз від Google.


Саме так виглядатиме майбутнє програмного забезпечення - не якесь антиутопічне «інженерів більше не буде через X років/місяців/днів», а максимально персоналізований UX on demand, що працює поверх вашого застосунку - який вже навіть не застосунок, а платформа для генерації окремих інтерфейсів під кожного користувача.

https://research.google/blog/generative-ui-a-rich-custom-visual-interactive-user-experience-for-any-prompt/
3👍3
Якщо ви ще не бачили цей гайд від OpenAI про AI-Native SDLC - варто глянути.

Коротко:
Чіткі етапи: Plan, Design, Build, Test, Review, Document, Deploy і Maintain
Чіткий розподіл відповідальності: Delegate, Review і Own

І до кожного є чеклист!

Дуже якісний вступ без води.
https://developers.openai.com/codex/guides/build-ai-native-engineering-team/
👍4🔥1
Цікаве спостереження: більшість coding agents тепер відкривають доступ до API або SDK.

Ринок змінюється: ми переходимо від "інтерфейсів у редакторі" до програмованих сервісів, які можна викликати через API.

Так само, як LLM API дозволяють інтегрувати ML у ваш продукт, ці нові API дозволяють виконувати завдання з написання коду "on demand"!

Ось список свіжих релізів:

Jules – https://developers.google.com/jules/api
Devin – https://docs.devin.ai/api-reference
GitHub Copilot – https://docs.github.com/en/rest/copilot
Cursor – https://cursor.com/docs/cloud-agent/api/endpoints
OpenAI Codex – https://developers.openai.com/codex/sdk
Claude – https://platform.claude.com/docs/en/agent-sdk/python
👍5
Product Overhang
Нещодавно дізнався про новий термін у контексті LLM - «product overhang». Це означає: «Модель уже могла це робити, але навколо цієї можливості просто ще не побудували продукт!»
Раніше шлях до стандарту, підтриманого відкритою та незалежною організацією, займав багато часу.

Зазвичай це ознака зрілості та масового впровадження: коли одна компанія вже не може володіти технологією, бо від неї залежить уся індустрія.


Дивовижно, але три відносно нові технології досягли цього статусу менш ніж за рік. Цикл наче стиснувся з 25 років (Unix) до 1 року (Agentic AI).

https://aaif.io/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation-aaif-anchored-by-new-project-contributions-including-model-context-protocol-mcp-goose-and-agents-md/
👍3
The AI Engineering Product Template

Більшість робочих процесів з AI-агентами розвалюються, щойно ви намагаєтесь їх масштабувати.

Один агент - магія. Десять агентів - катастрофа.

Я створив цей Template, щоб це виправити: https://kyrylai.com/2025/12/14/ai-engineering-product-template/
👍5❤‍🔥1
Розробка програмного забезпечення як стратегія в реальному часі (RTS).

Я почав писати це як блог-пост про Agent Tech Lead і дуже швидко перейшов до стратегії в реальному часі для розробки software.

Моя найкраща стаття 2025 року - гляньте, якщо хочете побачити, як виглядатиме створення софту через кілька років!

https://kyrylai.com/2025/12/23/becoming-an-aiagent-tech-lead/
👍7