Супер крута фіча від Cognition - DeepWiki! Спробував його на репозиторії мого курсу і результати дуже крутий!
https://deepwiki.com/kyryl-opens-ml/ml-in-production-practice
Однозначно варто використовувати для будь-якого open source коду, який ви використовуєте, і як бонус - він має MCP!
https://docs.devin.ai/work-with-devin/deepwiki-mcp
https://deepwiki.com/kyryl-opens-ml/ml-in-production-practice
Однозначно варто використовувати для будь-якого open source коду, який ви використовуєте, і як бонус - він має MCP!
https://docs.devin.ai/work-with-devin/deepwiki-mcp
❤3👍3
Cloud Run + GPU Zero scale = ❤️
Cloud Run тепер не лише має GPU, але й має можливість масштабування GPU до нуля! Чудовий варіант, якщо ви хочете самостійно хостити LLM не за всі гроші світу, враховуючи всі проблеми з конфіденційністю, IP та драму, що відбувається навколо.
Мій улюблений варіант - Modal, але, на жаль, не всі компанії його використовують - тому підтримка масштабування до нуля для GPU від GCP/AWS - це чудова новина!
- Cloud Run GPUs: https://cloud.google.com/blog/products/serverless/cloud-run-gpus-are-now-generally-available
- AWS: https://aws.amazon.com/blogs/machine-learning/unlock-cost-savings-with-the-new-scale-down-to-zero-feature-in-amazon-sagemaker-inference/
Cloud Run тепер не лише має GPU, але й має можливість масштабування GPU до нуля! Чудовий варіант, якщо ви хочете самостійно хостити LLM не за всі гроші світу, враховуючи всі проблеми з конфіденційністю, IP та драму, що відбувається навколо.
Мій улюблений варіант - Modal, але, на жаль, не всі компанії його використовують - тому підтримка масштабування до нуля для GPU від GCP/AWS - це чудова новина!
- Cloud Run GPUs: https://cloud.google.com/blog/products/serverless/cloud-run-gpus-are-now-generally-available
- AWS: https://aws.amazon.com/blogs/machine-learning/unlock-cost-savings-with-the-new-scale-down-to-zero-feature-in-amazon-sagemaker-inference/
Modal
Modal: High-performance AI infrastructure
Bring your own code, and run CPU, GPU, and data-intensive compute at scale. The serverless platform for AI and data teams.
👍7❤1
Нісенітниці про мультиагентні системи
Ковток свіжого повітря і викриття нісенітниць про мультиагентні системи.
https://cognition.ai/blog/dont-build-multi-agents
TLDR: використовуйте single-threaded агента для надійних застосунків!
Ковток свіжого повітря і викриття нісенітниць про мультиагентні системи.
https://cognition.ai/blog/dont-build-multi-agents
TLDR: використовуйте single-threaded агента для надійних застосунків!
👍5🔥2
Ось як виглядає сучасна розробка моделей:
- Єдина базова модель
- Кілька спеціалізованих адаптерів LoRA
- Подвійний вихід: один вектор для швидкості й multi-вектор для точності (підвищення продуктивності на 7–10 %)
Я був у захваті, коли з’явилася ColPali (чиста візуальна модель пошуку) - я навіть створив продукт на її основі: https://github.com/kyryl-opens-ml/no-ocr (не можу дочекатися оновлення до Jina 4).
Приємно бачити, як уніфікована система моделей перевершує ColPali у візуальному пошуку документів та інших завданнях пошуку.
Головний урок щодо даних: Curation beats collection.
Якщо ви працюєте з RAG або будь-яким процесом пошуку - обов’язково спробуйте цю модель!
https://jina.ai/news/jina-embeddings-v4-universal-embeddings-for-multimodal-multilingual-retrieval/
- Єдина базова модель
- Кілька спеціалізованих адаптерів LoRA
- Подвійний вихід: один вектор для швидкості й multi-вектор для точності (підвищення продуктивності на 7–10 %)
Я був у захваті, коли з’явилася ColPali (чиста візуальна модель пошуку) - я навіть створив продукт на її основі: https://github.com/kyryl-opens-ml/no-ocr (не можу дочекатися оновлення до Jina 4).
Приємно бачити, як уніфікована система моделей перевершує ColPali у візуальному пошуку документів та інших завданнях пошуку.
Головний урок щодо даних: Curation beats collection.
Якщо ви працюєте з RAG або будь-яким процесом пошуку - обов’язково спробуйте цю модель!
https://jina.ai/news/jina-embeddings-v4-universal-embeddings-for-multimodal-multilingual-retrieval/
🔥10
AI coding agents need engineering guardrails
Неочевидний інсайт: чим більше дозволяєш AI писати код, тим БІЛЬШЕ треба дотримуватись інженерних практик, а не менше.
Чому? Бо AI генерує код з швидкістю 10x - а значить може наплодити технічного боргу зі швидкістю 100x.
Essential guardrails:
- Модульна архітектура -> зміни від AI залишаються локальними
- Купа тестів -> ловимо галюни AI
- Тимчасові прев'ю envs -> бачимо що AI реально набудував перед мерджем
- CI/CD пайплайни -> код від AI не попадає в прод без перевірки
- Нудний техстек -> у AI більше даних для тренування
- Спостережувані системи -> дебажимо "креативні" рішення AI
Парадокс: щоб ефективно юзати тули які "автоматизують" кодинг, треба бути ще крутішим інженером ніж раніше.
Неочевидний інсайт: чим більше дозволяєш AI писати код, тим БІЛЬШЕ треба дотримуватись інженерних практик, а не менше.
Чому? Бо AI генерує код з швидкістю 10x - а значить може наплодити технічного боргу зі швидкістю 100x.
Essential guardrails:
- Модульна архітектура -> зміни від AI залишаються локальними
- Купа тестів -> ловимо галюни AI
- Тимчасові прев'ю envs -> бачимо що AI реально набудував перед мерджем
- CI/CD пайплайни -> код від AI не попадає в прод без перевірки
- Нудний техстек -> у AI більше даних для тренування
- Спостережувані системи -> дебажимо "креативні" рішення AI
Парадокс: щоб ефективно юзати тули які "автоматизують" кодинг, треба бути ще крутішим інженером ніж раніше.
👍12🫡1
Забирайте мій плейбук із vibe coding - реальний кейс, ключові уроки та шаблон спека!
🔗 https://kyrylai.com/2025/07/28/vibe-coding-ml-team-case-study
🔗 https://kyrylai.com/2025/07/28/vibe-coding-ml-team-case-study
Kyryl Opens ML
Case Study: Building a High-Velocity ML Team via Vibe Coding
See how vibe coding let us build a high-velocity ML team and ship AI-built products into production in 10 weeks. Benchmarks and lessons.
❤6
Відео-функція NotebookLM супер крута!
Щойно зробив з мого блог-посту відео-пояснення. Є деякі проблеми, але результат вражаючий з першого разу - https://www.youtube.com/watch?v=Y_Xj0FXdJ_A
Щойно зробив з мого блог-посту відео-пояснення. Є деякі проблеми, але результат вражаючий з першого разу - https://www.youtube.com/watch?v=Y_Xj0FXdJ_A
🔥9
Cursor створює PR.
Railway піднімає live прев’ю для нього.
Я мерджу, коли все виглядає добре.
Ось і весь цикл - швидко, безпечно, повторювано.
Деталі: https://kyrylai.com/2025/08/04/cursor-railway-vibe-coding-pr-environments/
Railway піднімає live прев’ю для нього.
Я мерджу, коли все виглядає добре.
Ось і весь цикл - швидко, безпечно, повторювано.
Деталі: https://kyrylai.com/2025/08/04/cursor-railway-vibe-coding-pr-environments/
Kyryl Opens ML
Cursor + Railway: Vibe Coding with Ephemeral PR Environments
Discover vibe coding: pair Cursor’s AI code generation with Railway’s ephemeral PR environments to preview every pull request live, test faster, and ship clean.
👍5🔥1
100% коду для цього графіка - від AI.
Без хайпу: реальні цифри. На простих задачах у проєктах з нуля +37.5%, на легасі +17.5%. На складних - скромно: +12.5% / +5%.
Дуже цікаві висновки: https://www.youtube.com/watch?v=tbDDYKRFjhk
Без хайпу: реальні цифри. На простих задачах у проєктах з нуля +37.5%, на легасі +17.5%. На складних - скромно: +12.5% / +5%.
Дуже цікаві висновки: https://www.youtube.com/watch?v=tbDDYKRFjhk
👍2👏1
Generative UI - це, напевно, найбільш недооцінений реліз від Google.
Саме так виглядатиме майбутнє програмного забезпечення - не якесь антиутопічне «інженерів більше не буде через X років/місяців/днів», а максимально персоналізований UX on demand, що працює поверх вашого застосунку - який вже навіть не застосунок, а платформа для генерації окремих інтерфейсів під кожного користувача.
https://research.google/blog/generative-ui-a-rich-custom-visual-interactive-user-experience-for-any-prompt/
Саме так виглядатиме майбутнє програмного забезпечення - не якесь антиутопічне «інженерів більше не буде через X років/місяців/днів», а максимально персоналізований UX on demand, що працює поверх вашого застосунку - який вже навіть не застосунок, а платформа для генерації окремих інтерфейсів під кожного користувача.
https://research.google/blog/generative-ui-a-rich-custom-visual-interactive-user-experience-for-any-prompt/
❤3👍3
Створювати власні датасети "на льоту" нарешті просто.
Написав гайд, як побудувати VC Discovery Engine для Secondary ринку.
Стек: Parallel AI (пошук) + Gemini 3 (верифікація).
Код і приклад тут: https://kyrylai.com/2025/11/28/building-a-vc-discovery-engine-finding-secondary-opportunities-with-parallel-ai-gemini-3/
Написав гайд, як побудувати VC Discovery Engine для Secondary ринку.
Стек: Parallel AI (пошук) + Gemini 3 (верифікація).
Код і приклад тут: https://kyrylai.com/2025/11/28/building-a-vc-discovery-engine-finding-secondary-opportunities-with-parallel-ai-gemini-3/
Kyryl Opens ML
Building a VC Discovery Engine: Finding Secondary Opportunities with Parallel AI & Gemini 3 - Kyryl Opens ML
LLMs are Discovery Engines! One of the most underrated use cases for LLMs is discovery. Even the most AI-skeptical people are excited about this! Data in private markets is opaque, scattered, and expensive (PitchBook licenses can cost $25k+). But the data…
👍7❤🔥1
Якщо ви ще не бачили цей гайд від OpenAI про AI-Native SDLC - варто глянути.
Коротко:
Чіткі етапи: Plan, Design, Build, Test, Review, Document, Deploy і Maintain
Чіткий розподіл відповідальності: Delegate, Review і Own
І до кожного є чеклист!
Дуже якісний вступ без води.
https://developers.openai.com/codex/guides/build-ai-native-engineering-team/
Коротко:
Чіткі етапи: Plan, Design, Build, Test, Review, Document, Deploy і Maintain
Чіткий розподіл відповідальності: Delegate, Review і Own
І до кожного є чеклист!
Дуже якісний вступ без води.
https://developers.openai.com/codex/guides/build-ai-native-engineering-team/
Openai
Building an AI-Native Engineering Team
How coding agents speed up the software development lifecycle
👍4🔥1
Цікаве спостереження: більшість coding agents тепер відкривають доступ до API або SDK.
Ринок змінюється: ми переходимо від "інтерфейсів у редакторі" до програмованих сервісів, які можна викликати через API.
Так само, як LLM API дозволяють інтегрувати ML у ваш продукт, ці нові API дозволяють виконувати завдання з написання коду "on demand"!
Ось список свіжих релізів:
Jules – https://developers.google.com/jules/api
Devin – https://docs.devin.ai/api-reference
GitHub Copilot – https://docs.github.com/en/rest/copilot
Cursor – https://cursor.com/docs/cloud-agent/api/endpoints
OpenAI Codex – https://developers.openai.com/codex/sdk
Claude – https://platform.claude.com/docs/en/agent-sdk/python
Ринок змінюється: ми переходимо від "інтерфейсів у редакторі" до програмованих сервісів, які можна викликати через API.
Так само, як LLM API дозволяють інтегрувати ML у ваш продукт, ці нові API дозволяють виконувати завдання з написання коду "on demand"!
Ось список свіжих релізів:
Jules – https://developers.google.com/jules/api
Devin – https://docs.devin.ai/api-reference
GitHub Copilot – https://docs.github.com/en/rest/copilot
Cursor – https://cursor.com/docs/cloud-agent/api/endpoints
OpenAI Codex – https://developers.openai.com/codex/sdk
Claude – https://platform.claude.com/docs/en/agent-sdk/python
👍5
Product Overhang
Нещодавно дізнався про новий термін у контексті LLM - «product overhang». Це означає: «Модель уже могла це робити, але навколо цієї можливості просто ще не побудували продукт!»
Нещодавно дізнався про новий термін у контексті LLM - «product overhang». Це означає: «Модель уже могла це робити, але навколо цієї можливості просто ще не побудували продукт!»
Раніше шлях до стандарту, підтриманого відкритою та незалежною організацією, займав багато часу.
Зазвичай це ознака зрілості та масового впровадження: коли одна компанія вже не може володіти технологією, бо від неї залежить уся індустрія.
Дивовижно, але три відносно нові технології досягли цього статусу менш ніж за рік. Цикл наче стиснувся з 25 років (Unix) до 1 року (Agentic AI).
https://aaif.io/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation-aaif-anchored-by-new-project-contributions-including-model-context-protocol-mcp-goose-and-agents-md/
Зазвичай це ознака зрілості та масового впровадження: коли одна компанія вже не може володіти технологією, бо від неї залежить уся індустрія.
Дивовижно, але три відносно нові технології досягли цього статусу менш ніж за рік. Цикл наче стиснувся з 25 років (Unix) до 1 року (Agentic AI).
https://aaif.io/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation-aaif-anchored-by-new-project-contributions-including-model-context-protocol-mcp-goose-and-agents-md/
👍3
The AI Engineering Product Template
Більшість робочих процесів з AI-агентами розвалюються, щойно ви намагаєтесь їх масштабувати.
Один агент - магія. Десять агентів - катастрофа.
Я створив цей Template, щоб це виправити: https://kyrylai.com/2025/12/14/ai-engineering-product-template/
Більшість робочих процесів з AI-агентами розвалюються, щойно ви намагаєтесь їх масштабувати.
Один агент - магія. Десять агентів - катастрофа.
Я створив цей Template, щоб це виправити: https://kyrylai.com/2025/12/14/ai-engineering-product-template/
👍5❤🔥1
Розробка програмного забезпечення як стратегія в реальному часі (RTS).
Я почав писати це як блог-пост про Agent Tech Lead і дуже швидко перейшов до стратегії в реальному часі для розробки software.
Моя найкраща стаття 2025 року - гляньте, якщо хочете побачити, як виглядатиме створення софту через кілька років!
https://kyrylai.com/2025/12/23/becoming-an-aiagent-tech-lead/
Я почав писати це як блог-пост про Agent Tech Lead і дуже швидко перейшов до стратегії в реальному часі для розробки software.
Моя найкраща стаття 2025 року - гляньте, якщо хочете побачити, як виглядатиме створення софту через кілька років!
https://kyrylai.com/2025/12/23/becoming-an-aiagent-tech-lead/
Kyryl Opens ML
Agent Tech Lead: Leading AI Coding Agents | Kyryl Opens ML
Learn how the Agent Tech Lead role is redefining software engineering by leading AI coding agents, LLM workflows, and agent-based development.
👍7
Один із найочікуваніших "must-reads"! Неважливо, працюєте ви у сфері баз даних чи ні: https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html
Andy Pavlo - Carnegie Mellon University
Databases in 2025: A Year in Review
The world tried to kill Andy off but he had to stay alive to to talk about what happened with databases in 2025.
❤5