Data Science | Тесты – Telegram
Data Science | Тесты
2.66K subscribers
27 photos
473 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Разница между K-Means и KNN

1. K-Means (кластеризация):
o Используется для группировки данных в кластеры на основе схожести.
o Это алгоритм обучения без учителя.
o Результат — центры кластеров, данные распределяются вокруг них.
2. KNN (K-Nearest Neighbors):
o Алгоритм классификации или регрессии, находящий ближайших соседей для прогнозирования.
o Это алгоритм обучения с учителем.
o Результат зависит от разметки данных (меток классов).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💊1
🤔 Какой метод машинного обучения используется для кластеризации текстов на основе смысловых значений слов?
Anonymous Quiz
4%
Decision Tree
6%
Логистическая регрессия
80%
Word Embeddings
10%
Автоэнкодеры
💊5
🤔 Какие технологии применяют для больших данных?
Anonymous Quiz
43%
Hadoop
40%
Spark
10%
NoSQL базы данных
7%
Kubernetes
💊1
🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод в машинном обучении используется для балансировки классов в несбалансированных данных?
Anonymous Quiz
12%
K-ближайших соседей (KNN)
7%
Случайный лес
74%
SMOTE
7%
Градиентный бустинг
👍1💊1
🤔 Какой метод используется для балансировки несбалансированных данных?
Anonymous Quiz
89%
SMOTE
8%
PCA
3%
T-SNE
0%
K-means
💊1
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение, используя L2 регуляризацию?
Anonymous Quiz
41%
Lasso Regression
5%
Random Forest
50%
Ridge Regression
4%
K-Means Clustering
🤔 Какой метод машинного обучения используется для обнаружения выбросов путем построения гиперплоскостей, отделяющих аномалии от нормальных данных?
Anonymous Quiz
8%
Линейная регрессия
31%
Изолирующий лес
58%
Метод опорных векторов (SVM)
3%
Логистическая регрессия
🤔 При свёртке картинки HxW матрицей 3x3, что получится в итоге?

Результирующий размер изображения будет (H−2)×(W−2)(H-2) \times (W-2), если не использовать дополнение, так как свёртка "обрезает" края.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения дисперсии в ансамблевом обучении?
Anonymous Quiz
14%
Рандомизация
12%
Аугментация данных
43%
Усреднение
31%
Адаптивный бустинг
🤔 Какой метод используется для снижения размерности данных, учитывающий корреляцию между переменными?
Anonymous Quiz
45%
Главные компоненты
40%
t-SNE
8%
Линейная регрессия
8%
Многомерный масштабирование
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, используя взвешивание слабых моделей?
Anonymous Quiz
31%
Bagging
35%
Boosting
15%
Stacking
19%
Ensemble Learning
💊6🤔1
🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений с заменой?
Anonymous Quiz
41%
Bagging
15%
Boosting
18%
Stacking
26%
Random Forest
🤔 Какие подходы понижения размерности известны?

Основные подходы понижения размерности включают метод главных компонент (PCA), сингулярное разложение (SVD), t-SNE и UMAP. PCA снижает размерность данных, находя новые оси, которые объясняют наибольшую дисперсию данных. t-SNE и UMAP используются для визуализации данных в пространстве низкой размерности, сохраняя их топологическую структуру. Эти методы позволяют уменьшить количество признаков при сохранении важной информации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации временных рядов на основе их циклических паттернов?
Anonymous Quiz
8%
Decision Tree
11%
Логистическая регрессия
72%
Fourier Analysis
8%
Автоэнкодеры
🤔 Какой метод уменьшает дисперсию, используя ансамблевое обучение?
Anonymous Quiz
36%
Boosting
8%
Stacking
42%
Bagging
14%
Ensemble Learning
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM