Разбираются формулы для оценки читаемости (формула Флеша-Кинкейда), затем автор переходит к более сложным подходам, включая использование человеческих бенчмарков, таких как CLEAR (CommonLit Ease of Readability) корпус, который позволяет оценивать тексты на основе их легкости восприятия человеком.
Завершающая часть статьи посвящена использованию LLMs, в частности модели GPT-4 Turbo, для оценки читаемости текстов и сравнения их с результатами, полученными с помощью традиционных формул.
Завершающая часть статьи посвящена использованию LLMs, в частности модели GPT-4 Turbo, для оценки читаемости текстов и сравнения их с результатами, полученными с помощью традиционных формул.
🔥5❤🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3 3
Bидео демонстрирует примеры кода для вычисления перестановочной важности в mlxtend и scikit-learn.
Перестановочная важность (Feature Permutation Importance) - универсальный и модельно-независимый способ вычисления значимости признаков на основе классификатора или регрессионной модели.
https://youtu.be/meTXOuFV-s8?si=WgXUPGXGcb6Ixnti
Перестановочная важность (Feature Permutation Importance) - универсальный и модельно-независимый способ вычисления значимости признаков на основе классификатора или регрессионной модели.
https://youtu.be/meTXOuFV-s8?si=WgXUPGXGcb6Ixnti
YouTube
13.4.3 Feature Permutation Importance Code Examples (L13: Feature Selection)
Sebastian's books: https://sebastianraschka.com/books/
This video shows code examples for computing permutation importance in mlxtend and scikit-learn.
Permutation importance is a model-agnostic, versatile way for computing the importance of features based…
This video shows code examples for computing permutation importance in mlxtend and scikit-learn.
Permutation importance is a model-agnostic, versatile way for computing the importance of features based…
❤🔥4👍1
Обзор посвящен малым языковым моделям, которые используются на мобильных устройствах. Исследуются их архитектуры, данные для обучения и производительность в задачах, таких как логические рассуждения и обучение на контексте.
🔥3 2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3 1
https://habr.com/ru/companies/jugru/articles/722342/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤🔥2 2
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤🔥2 1
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8
🤩Разбор регуляризации в глубоком обучении, подробно рассматривая компромисс между bias и variance для предотвращения переобучения и недообучения.
🩶Авторы охватывают различные методы регуляризации, включая L1, L2, Elastic Net, а также техники, такие как отсев, нормализация по батчам и аугментация данных, предоставляя обширный обзор для эффективного построения устойчивых моделей глубокого обучения.
https://theaisummer.com/regularization/
🩶Авторы охватывают различные методы регуляризации, включая L1, L2, Elastic Net, а также техники, такие как отсев, нормализация по батчам и аугментация данных, предоставляя обширный обзор для эффективного построения устойчивых моделей глубокого обучения.
https://theaisummer.com/regularization/
❤🔥4 2
Особое внимание уделяется рекомендациям по увеличению объема данных, балансировке классов и соблюдению этических норм.
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Статья представляет основные библиотеки Python для машинного обучения, включая NumPy, Pandas, Scikit-learn, XGBoost, LightGBM и CatBoost.
Также упоминаются библиотеки для нейросетей (PyTorch, TensorFlow) и обработки данных (NLTK, OpenCV).
От экспертов даны рекомендации для начинающих по последовательности шагов в изучении машинного обучения.
Также упоминаются библиотеки для нейросетей (PyTorch, TensorFlow) и обработки данных (NLTK, OpenCV).
От экспертов даны рекомендации для начинающих по последовательности шагов в изучении машинного обучения.
❤🔥3👍3 2
Статья описывает методы обучения с использованием SVM, включая классификацию и регрессию.
Она объясняет основные параметры моделей SVM, их применение для линейных и нелинейных данных, а также методы оптимизации и выбора гиперпараметров для улучшения точности модели.
https://scikit-learn.ru/stable/modules/svm.html
Она объясняет основные параметры моделей SVM, их применение для линейных и нелинейных данных, а также методы оптимизации и выбора гиперпараметров для улучшения точности модели.
https://scikit-learn.ru/stable/modules/svm.html
Статья охватывает методы обучения машинных моделей без использования меток данных, включая обучение без учителя, самообучение и генеративные модели.
Эти подходы минимизируют зависимость от размеченных наборов данных и находят применение в задачах кластеризации, обработки изображений и текстов.
https://habr.com/ru/amp/publications/842444/
Эти подходы минимизируют зависимость от размеченных наборов данных и находят применение в задачах кластеризации, обработки изображений и текстов.
https://habr.com/ru/amp/publications/842444/
🔥3 2
Статья описывает концепцию GraphRAG, объединяющая графы знаний с методами RAG для улучшения поиска и генерации ответов на основе структурированных данных.
Это позволяет моделям, таким как LLM, эффективно обрабатывать сложные и специализированные запросы, улучшая точность ответов.
https://www.kdnuggets.com/an-introduction-to-graph-rag
Это позволяет моделям, таким как LLM, эффективно обрабатывать сложные и специализированные запросы, улучшая точность ответов.
https://www.kdnuggets.com/an-introduction-to-graph-rag
👍3 2❤🔥1
Статья о том, как GraphRAG улучшает традиционный метод RAG, интегрируя графы знаний с большими языковыми моделями, что позволяет более точно и контекстуализированно извлекать информацию для генерации ответов.
Автор описывает различные архитектуры GraphRAG, а также трудности, связанные с построением и поддержанием графов знаний.
https://gradientflow.substack.com/p/graphrag-design-patterns-challenges
Автор описывает различные архитектуры GraphRAG, а также трудности, связанные с построением и поддержанием графов знаний.
https://gradientflow.substack.com/p/graphrag-design-patterns-challenges
❤🔥6🔥3
Статья рассказывает о том, как DS используется в социальных проектах для решения глобальных проблем, таких как экология, здравоохранение и образование.
Приводятся примеры реальных инициатив, где аналитика данных помогает организациям повысить свою эффективность и достичь позитивных изменений в обществе.
https://www.kdnuggets.com/data-science-for-social-good-real-world-projects-making-a-difference
Приводятся примеры реальных инициатив, где аналитика данных помогает организациям повысить свою эффективность и достичь позитивных изменений в обществе.
https://www.kdnuggets.com/data-science-for-social-good-real-world-projects-making-a-difference
🔥6
Пять шпаргалок в DS, которые обобщают ключевые концепции и инструменты в области DS, ML статистики.
Эти ресурсы помогают быстро освоить основные методы и алгоритмы, необходимые для успешного старта в сфере данных.
https://www.kdnuggets.com/5-cheat-sheets-getting-started-data-science
Эти ресурсы помогают быстро освоить основные методы и алгоритмы, необходимые для успешного старта в сфере данных.
https://www.kdnuggets.com/5-cheat-sheets-getting-started-data-science
🔥4👍1
Статья знакомит с новым Python-менеджером пакетов, который призван улучшить работу с зависимостями и ускорить процесс разработки за счет оптимизированной архитектуры.
Инструмент предлагает решение для быстрого обновления пакетов и эффективного управления проектами, снижая сложность интеграции сторонних библиотек.
https://www.kdnuggets.com/new-python-package-manager
Инструмент предлагает решение для быстрого обновления пакетов и эффективного управления проектами, снижая сложность интеграции сторонних библиотек.
https://www.kdnuggets.com/new-python-package-manager
👍4
В статье описываются ключевые принципы создания устойчивых ETL пайплайнов для обработки данных, акцентируя внимание на автоматизации, масштабируемости и обработке ошибок.
Также рассматриваются лучшие практики для интеграции различных инструментов и обеспечения качества данных в процессе анализа и ML.
https://www.kdnuggets.com/developing-robust-etl-pipelines-for-data-science-projects
Также рассматриваются лучшие практики для интеграции различных инструментов и обеспечения качества данных в процессе анализа и ML.
https://www.kdnuggets.com/developing-robust-etl-pipelines-for-data-science-projects
👍4 2❤🔥1
Статья раскрывает оптимизацию RAG через интеграцию ГБД, улучшая семантическое извлечение и контекстуализацию для LLM, что снижает галлюцинации.
Архитектурные подходы, включая кластеризацию и схемы, усиливают точность и осведомленность моделей в специфических доменах.
https://arxiv.org/abs/2411.09702
Архитектурные подходы, включая кластеризацию и схемы, усиливают точность и осведомленность моделей в специфических доменах.
https://arxiv.org/abs/2411.09702
👍1 1