Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.42K photos
667 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Сингулярное разложение

Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.

Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.

#ЛинейнаяАлгебра
👍18🔥7
Numpy: 3 полезных фишки 📈

Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.

#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Введение в NLTK: Часть 1 🐍

NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать 🔍

#NLP
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5
🎲Схема по построению систем распознавания
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
Введение в Theano: Часть 2 ⁉️

Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).

#Theano
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Гетероскедастичность 📈

Если присутствует гетероскедастичность, то экземпляры с высокой дисперсией будут иметь большее влияние на прогноз.

Наличие гетероскедастичности делает коэффициенты менее точными, и, следовательно, правильные коэффициенты находятся дальше от значения генеральной совокупности.

#Регрессия #Статистика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Алгоритм Монте-Карло ⚙️

Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.

#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁

OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ 📝

Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь ⚙️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨‍💻2
Рекомендательные системы 💡

Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация🔍

#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
PyData - разного рода мероприятий, которые проходят по всему миру и посвящены анализу данных 🖥

В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24