#полезное
👨💻 ML после релиза: почему модель может сломаться — и как это вовремя заметить
Внедрили модель, подтвердили гипотезу, получили эффект — работа сделана? Увы, нет.
После деплоя начинается настоящее испытание:
🟠 данные меняются,
🟠 поведение пользователей эволюционирует,
🟠 а ваша модель может незаметно терять эффективность.
Must-read для тех, кто работает с ML в продакшене и хочет, чтобы решения были устойчивыми, а не разовыми.
Читайте, делитесь и не забывайте наблюдать за своими моделями: https://proglib.io/sh/fjpFLVWn8Z
👉 Новости 👉 База вопросов
Внедрили модель, подтвердили гипотезу, получили эффект — работа сделана? Увы, нет.
После деплоя начинается настоящее испытание:
Must-read для тех, кто работает с ML в продакшене и хочет, чтобы решения были устойчивыми, а не разовыми.
Читайте, делитесь и не забывайте наблюдать за своими моделями: https://proglib.io/sh/fjpFLVWn8Z
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
📞 Промт дня: анализ важности признаков после обучения модели
После того как вы обучили модель (особенно если это ансамблевый метод вроде Random Forest или градиентного бустинга), важно понять, какие признаки влияют на предсказания.
Это помогает:
— интерпретировать модель,
— упростить её (feature selection),
— обнаружить «лишние» или дублирующие признаки.
Промт:
Рекомендованные инструменты:
✅
✅
✅
👉 Новости 👉 База вопросов
После того как вы обучили модель (особенно если это ансамблевый метод вроде Random Forest или градиентного бустинга), важно понять, какие признаки влияют на предсказания.
Это помогает:
— интерпретировать модель,
— упростить её (feature selection),
— обнаружить «лишние» или дублирующие признаки.
Промт:
Проанализируй важность признаков обученной модели. Выполни следующие шаги:
— Извлеки и отсортируй признаки по степени важности.
— Построй barplot с топ-10 признаками.
— Проверь, есть ли признаки с нулевой или близкой к нулю важностью — возможно, их можно удалить.
— Если модель поддерживает SHAP / permutation importance — добавь соответствующую визуализацию.
— Сформулируй гипотезы: почему те или иные признаки оказались важны? Как это согласуется с предметной областью?
Рекомендованные инструменты:
model.feature_
importances_ — в sklearn-моделях, XGBoost, LightGBMeli5, shap, sklearn.inspection.permutation_importance — для глубокой интерпретацииseaborn.barplot, matplotlib — для наглядных графиковPlease open Telegram to view this post
VIEW IN TELEGRAM
#Собес #mongoDB
🤔 Что такое индексы в MongoDB?
Индексы - это структуры, которые упрощают и ускоряют поиск данных в оллекциях MongoDB. Они позволяют базе данных эффективно находить записи, не сканируя все документы в коллекции.
👉 Новости 👉 База вопросов
Индексы - это структуры, которые упрощают и ускоряют поиск данных в оллекциях MongoDB. Они позволяют базе данных эффективно находить записи, не сканируя все документы в коллекции.
Please open Telegram to view this post
VIEW IN TELEGRAM
#книги
😊 MIT выложил в открытый доступ шикарный учебник по компьютерному зрению:
https://visionbook.mit.edu
Foundations of Computer Vision — концентрат базовых концепций CV через призму image processing и ML. Книга написана Торральбой, Исолой и Фрименом — ребята знают, о чём говорят.
Без воды: короткие главы, мощные визуализации, акцент на интуитивное понимание. Отлично зайдёт тем, кто входит в тему, но и опытным спецам будет чем поживиться.
👉 Новости 👉 База вопросов
https://visionbook.mit.edu
Foundations of Computer Vision — концентрат базовых концепций CV через призму image processing и ML. Книга написана Торральбой, Исолой и Фрименом — ребята знают, о чём говорят.
Без воды: короткие главы, мощные визуализации, акцент на интуитивное понимание. Отлично зайдёт тем, кто входит в тему, но и опытным спецам будет чем поживиться.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😵💫 Знал ли ты, что есть библиотека на Python под названием Pix2TeX, которая умеет превращать изображения с формулами в LaTeX-код?
Ссылка на репозиторий GitHub
👉 Новости 👉 База вопросов
Ссылка на репозиторий GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#полезное
😵💫 Как объяснить коэффициенты логистической регрессии без технических деталей
Представим так:
У нас есть модель, которая помогает понять — произойдёт ли какое-то событие. Например: купит ли человек товар, кликнет ли на рекламу или подпишется на рассылку.
Каждый признак (фактор) — это как один из аргументов «за» или «против» исхода. У каждого есть своя «весомость» — коэффициент:
🟠 Если коэффициент положительный — этот фактор повышает шанс, что событие произойдёт.
🟠 Если отрицательный — наоборот, снижает вероятность.
🟠 Чем больше по модулю число — тем сильнее влияние этого фактора.
Чтобы понять, насколько фактор влияет, можно посмотреть наэто показывает, во сколько раз увеличиваются шансы.
Например:
Есликаждый дополнительный «балл» этого признака повышает шансы на 50%.
👉 Новости 👉 База вопросов
Представим так:
У нас есть модель, которая помогает понять — произойдёт ли какое-то событие. Например: купит ли человек товар, кликнет ли на рекламу или подпишется на рассылку.
Каждый признак (фактор) — это как один из аргументов «за» или «против» исхода. У каждого есть своя «весомость» — коэффициент:
Чтобы понять, насколько фактор влияет, можно посмотреть на
exp(коэффициент) — Например:
Если
exp(коэффициент) = 1.5, это значит: Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #mongoDB
🤔 Расскажите о структуре Objectld
Objectld - это уникальный идентификатор для документов в MongoDB. Он состоит из отметки времени, идентификатора машины, идентификатора процесса и инкрементного счетчика.
👉 Новости 👉 База вопросов
Objectld - это уникальный идентификатор для документов в MongoDB. Он состоит из отметки времени, идентификатора машины, идентификатора процесса и инкрементного счетчика.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤓 Движок RAG для глубокого понимания документов
RAGFlow позволяет создавать корпоративного уровня RAG-воркфлоу для работы со сложными документами с обоснованными цитированиями.
Поддерживает мультимодальное понимание данных, веб-поиск, глубокие исследования и т.д.
Полностью локальный и с открытым исходным кодом, более 55 тысяч звёзд на GitHub
Гитхаб
👉 Новости 👉 База вопросов
RAGFlow позволяет создавать корпоративного уровня RAG-воркфлоу для работы со сложными документами с обоснованными цитированиями.
Поддерживает мультимодальное понимание данных, веб-поиск, глубокие исследования и т.д.
Полностью локальный и с открытым исходным кодом, более 55 тысяч звёзд на GitHub
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#полезное
🛞 DiffusionRenderer (Cosmos): Neural Inverse and Forward Rendering with Video Diffusion Models
Cosmos DiffusionRenderer — это современный фреймворк для нейросетевого de-lighting и re-lighting видео и изображений.
Новый релиз даёт качественный скачок по сравнению с предыдущей версией: ещё более чистое удаление и добавление освещения благодаря архитектуре NVIDIA Cosmos и улучшенному пайплайну обработки данных.
Минимальные требования:
🟠 Python 3.10
🟠 NVIDIA GPU с минимум 16 ГБ VRAM (рекомендуется ≥24 ГБ)
🟠 NVIDIA драйверы и CUDA 12.0+
🟠 Свободно ≥70 ГБ на диске
Проект протестирован на Ubuntu 20.04 и видеокартах NVIDIA A100/A5000.
Гитхаб
👉 Новости 👉 База вопросов
Cosmos DiffusionRenderer — это современный фреймворк для нейросетевого de-lighting и re-lighting видео и изображений.
Новый релиз даёт качественный скачок по сравнению с предыдущей версией: ещё более чистое удаление и добавление освещения благодаря архитектуре NVIDIA Cosmos и улучшенному пайплайну обработки данных.
Минимальные требования:
Проект протестирован на Ubuntu 20.04 и видеокартах NVIDIA A100/A5000.
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
#видео
😎 End-to-end проект по машинному обучению
Нашёл годный пошаговый гайд по ML-проекту.
Он начинается с базового EDA и обучает интеграции с MLOps с использованием таких инструментов, как ZenML и MLflow для отслеживания экспериментов и деплоймента.
Смотреть видео
👉 Новости 👉 База вопросов
Нашёл годный пошаговый гайд по ML-проекту.
Он начинается с базового EDA и обучает интеграции с MLOps с использованием таких инструментов, как ZenML и MLflow для отслеживания экспериментов и деплоймента.
Смотреть видео
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #mongoDB
🤔 Какие факторы следует учитывать в процессе разработки схемы MongoDB?
При проектировании схемы в MongoDB важно учитывать потребности пользователей, особенности работы с данными и оптимизацию запросов. Схема должна быть гибкой и подходить для работы с документами, которые часто используются вместе.
👉 Новости 👉 База вопросов
При проектировании схемы в MongoDB важно учитывать потребности пользователей, особенности работы с данными и оптимизацию запросов. Схема должна быть гибкой и подходить для работы с документами, которые часто используются вместе.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😘 AI-агенты наконец-то могут взаимодействовать с вашим фронтендом
Протокол AG-UI устраняет критически важный разрыв между AI-агентами и фронтенд-приложениями, обеспечивая бесшовное взаимодействие между человеком и агентом.
MCP: от агентов к инструментам
A2A: от агентов к агентам
AG-UI: от агентов к пользователям
Полностью с открытым исходным кодом. Вот официальный репозиторий AG-UI от CopilotKit на GitHub
👉 Новости 👉 База вопросов
Протокол AG-UI устраняет критически важный разрыв между AI-агентами и фронтенд-приложениями, обеспечивая бесшовное взаимодействие между человеком и агентом.
MCP: от агентов к инструментам
A2A: от агентов к агентам
AG-UI: от агентов к пользователям
Полностью с открытым исходным кодом. Вот официальный репозиторий AG-UI от CopilotKit на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #mongoDB
🤔 Что такое шардирование в MongoDB?
Шардирование - это процесс горизонтального разделения данных между несколькими серверами для обеспечения масштабируемости и производительности базы данных. Каждый сервер (или шард) хранит часть данных. MongoDB использует шардирование, чтобы распределять нагрузку и обрабатывать большие обьемы данных.
👉 Новости 👉 База вопросов
Шардирование - это процесс горизонтального разделения данных между несколькими серверами для обеспечения масштабируемости и производительности базы данных. Каждый сервер (или шард) хранит часть данных. MongoDB использует шардирование, чтобы распределять нагрузку и обрабатывать большие обьемы данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😊 У Microsoft вышел бесплатный курс по MCP для начинающих с 10 практическими лабораторными работами
Изучайте основы MCP на практике с примерами на .NET, Java, TypeScript, JavaScript и Python в среде VS Code. Все структурно и доступно на 40+ языках мира (есть русский, но машинный перевод)
Гитхаб
👉 Новости 👉 База вопросов
Изучайте основы MCP на практике с примерами на .NET, Java, TypeScript, JavaScript и Python в среде VS Code. Все структурно и доступно на 40+ языках мира (есть русский, но машинный перевод)
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😬 AlphaEvolve: ИИ от DeepMind, который создаёт новые алгоритмы
В мае 2025 года DeepMind представила AlphaEvolve — универсального ИИ-агента, способного самостоятельно разрабатывать и оптимизировать алгоритмы. Это не просто генератор кода: AlphaEvolve сочетает мощь языковых моделей Gemini с эволюционными методами поиска и автоматической проверкой решений.
Что умеет AlphaEvolve?
🔵 Решение сложных математических задач: AlphaEvolve улучшил нижнюю границу числа поцелуев в 11 измерениях с 592 до 593 — впервые за десятилетия :contentReference[oaicite:0]{index=0}.
🔵 Оптимизация алгоритмов умножения матриц: Превзошёл алгоритм Штрассена 1969 года, сократив количество умножений для 4×4 матриц с 49 до 48 :contentReference[oaicite:1]{index=1}.
🔵 Улучшение инфраструктуры Google: Повысил эффективность дата-центров на 1%, оптимизировал дизайн TPU и ускорил обучение моделей Gemini :contentReference[oaicite:2]{index=2}.
Как это работает?
AlphaEvolve использует:
1⃣ Исходный алгоритм и функцию оценки.
2⃣ Языковую модель Gemini, чтобы генерировать варианты решения.
3⃣ Автоматическую проверку для оценки эффективности каждого варианта.
4⃣ Эволюционный цикл: лучшие решения сохраняются и используются для генерации новых.
Такой подход позволяет AlphaEvolve находить решения, которые ранее были недоступны даже экспертам.
Результаты
- В 75% случаев AlphaEvolve воспроизводил известные оптимальные решения.
- В 20% случаев находил новые, более эффективные решения.
- В оставшихся 5% — результаты были хуже известных, что подчёркивает необходимость дальнейших исследований :contentReference[oaicite:3]{index=3}.
Почему это важно?
AlphaEvolve демонстрирует, что ИИ способен не только повторять известные решения, но и создавать новые знания. Это шаг к ИИ, который может активно участвовать в научных открытиях и инженерных разработках.
Подробнее
👉 Новости 👉 База вопросов
В мае 2025 года DeepMind представила AlphaEvolve — универсального ИИ-агента, способного самостоятельно разрабатывать и оптимизировать алгоритмы. Это не просто генератор кода: AlphaEvolve сочетает мощь языковых моделей Gemini с эволюционными методами поиска и автоматической проверкой решений.
Что умеет AlphaEvolve?
Как это работает?
AlphaEvolve использует:
Такой подход позволяет AlphaEvolve находить решения, которые ранее были недоступны даже экспертам.
Результаты
- В 75% случаев AlphaEvolve воспроизводил известные оптимальные решения.
- В 20% случаев находил новые, более эффективные решения.
- В оставшихся 5% — результаты были хуже известных, что подчёркивает необходимость дальнейших исследований :contentReference[oaicite:3]{index=3}.
Почему это важно?
AlphaEvolve демонстрирует, что ИИ способен не только повторять известные решения, но и создавать новые знания. Это шаг к ИИ, который может активно участвовать в научных открытиях и инженерных разработках.
Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
😐 OpenAI готовит ChatGPT к конкуренции с Google Workspace и Office 365.
По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету.
Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента.
theinformation.com
👉 Новости 👉 База вопросов
По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету.
Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента.
theinformation.com
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
YeaHub
Главные новости и обновления платформы
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
#Собес #ScikitLearn
🤔 Как реализовать анализ главных компонент (РСА) с использованием Scikit-Learn?
Для реализации РСА с использованием Scikit-Learn нужно сначала нормализовать данные, а затем применить класс
👉 Новости 👉 База вопросов
Для реализации РСА с использованием Scikit-Learn нужно сначала нормализовать данные, а затем применить класс
рса из модуля sklearn.decomposition . Указывая количество компонент, которые нужно оставить, можно уменьшить размерность данных, сохраняя как можно больше информации. Результатом является набор данных с меньшим числом признаков.Please open Telegram to view this post
VIEW IN TELEGRAM