Data Science | Тесты – Telegram
Data Science | Тесты
2.66K subscribers
27 photos
473 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
58%
PCA
26%
PCA
10%
LDA
6%
NMF
💊19🤔8👍2
🤔 Как использовать P-value, когда мы проверяем гипотезу?

P-value показывает вероятность получения текущих результатов при условии, что нулевая гипотеза верна. Если P-value ниже уровня значимости, нулевая гипотеза отвергается.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
56%
PCA
31%
PCA
8%
LDA
5%
NMF
💊23🤔7
🤔 Какой метод часто применяют для оценки точности модели классификации?
Anonymous Quiz
88%
Precision
5%
K-means
4%
PCA
4%
Линейная регрессия
💊1
🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения размерности данных?
Anonymous Quiz
4%
K-means
87%
T-SNE
5%
Логистическая регрессия
4%
Линейная регрессия
🤔 Какой метод оптимизации используется в алгоритмах машинного обучения для минимизации функции потерь?
Anonymous Quiz
87%
Gradient Descent
5%
Random Forest
2%
k-Nearest Neighbors
7%
Support Vector Machine
💊2
🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Разница между K-Means и KNN

1. K-Means (кластеризация):
o Используется для группировки данных в кластеры на основе схожести.
o Это алгоритм обучения без учителя.
o Результат — центры кластеров, данные распределяются вокруг них.
2. KNN (K-Nearest Neighbors):
o Алгоритм классификации или регрессии, находящий ближайших соседей для прогнозирования.
o Это алгоритм обучения с учителем.
o Результат зависит от разметки данных (меток классов).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💊1
🤔 Какой метод машинного обучения используется для кластеризации текстов на основе смысловых значений слов?
Anonymous Quiz
4%
Decision Tree
6%
Логистическая регрессия
80%
Word Embeddings
10%
Автоэнкодеры
💊5
🤔 Какие технологии применяют для больших данных?
Anonymous Quiz
43%
Hadoop
40%
Spark
10%
NoSQL базы данных
7%
Kubernetes
💊1
🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод в машинном обучении используется для балансировки классов в несбалансированных данных?
Anonymous Quiz
12%
K-ближайших соседей (KNN)
7%
Случайный лес
74%
SMOTE
7%
Градиентный бустинг
👍1💊1
🤔 Какой метод используется для балансировки несбалансированных данных?
Anonymous Quiz
89%
SMOTE
8%
PCA
3%
T-SNE
0%
K-means
💊1
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение, используя L2 регуляризацию?
Anonymous Quiz
41%
Lasso Regression
5%
Random Forest
50%
Ridge Regression
4%
K-Means Clustering
🤔 Какой метод машинного обучения используется для обнаружения выбросов путем построения гиперплоскостей, отделяющих аномалии от нормальных данных?
Anonymous Quiz
8%
Линейная регрессия
31%
Изолирующий лес
58%
Метод опорных векторов (SVM)
3%
Логистическая регрессия