Сингулярное разложение
Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.
Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.
#ЛинейнаяАлгебра
Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.
Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.
#ЛинейнаяАлгебра
👍18🔥7
Numpy: 3 полезных фишки 📈
Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.
#Numpy
Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.
#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Введение в NLTK: Часть 1 🐍
NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать🔍
#NLP
NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать
#NLP
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
Введение в Theano: Часть 2 ⁉️
Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).
#Theano
Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).
#Theano
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Гетероскедастичность 📈
⏺ Если присутствует гетероскедастичность, то экземпляры с высокой дисперсией будут иметь большее влияние на прогноз.
⏺ Наличие гетероскедастичности делает коэффициенты менее точными, и, следовательно, правильные коэффициенты находятся дальше от значения генеральной совокупности.
#Регрессия #Статистика
#Регрессия #Статистика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Алгоритм Монте-Карло ⚙️
Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.
#Методы #Алгоритмы
Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.
#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁
OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ📝
Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь⚙️
OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ
Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨💻2
Рекомендательные системы 💡
Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация🔍
#РекомендательныеСистемы
Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация
#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
PyData - разного рода мероприятий, которые проходят по всему миру и посвящены анализу данных 🖥
В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24