Сингулярное разложение
Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.
Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.
#ЛинейнаяАлгебра
Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.
Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.
#ЛинейнаяАлгебра
👍18🔥7
Numpy: 3 полезных фишки 📈
Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.
#Numpy
Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.
#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Введение в NLTK: Часть 1 🐍
NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать🔍
#NLP
NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать
#NLP
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
Введение в Theano: Часть 2 ⁉️
Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).
#Theano
Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).
#Theano
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Гетероскедастичность 📈
⏺ Если присутствует гетероскедастичность, то экземпляры с высокой дисперсией будут иметь большее влияние на прогноз.
⏺ Наличие гетероскедастичности делает коэффициенты менее точными, и, следовательно, правильные коэффициенты находятся дальше от значения генеральной совокупности.
#Регрессия #Статистика
#Регрессия #Статистика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Алгоритм Монте-Карло ⚙️
Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.
#Методы #Алгоритмы
Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.
#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁
OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ📝
Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь⚙️
OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ
Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨💻2
Рекомендательные системы 💡
Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация🔍
#РекомендательныеСистемы
Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация
#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
PyData - разного рода мероприятий, которые проходят по всему миру и посвящены анализу данных 🖥
В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24
MLFlow ⚙️
MLflow — один из самых стабильных и легких инструментов, позволяющий специалистам по Data Science управлять жизненным циклом моделей машинного обучения.
MLflow — один из самых стабильных и легких инструментов, позволяющий специалистам по Data Science управлять жизненным циклом моделей машинного обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15