Data Science | Тесты – Telegram
Data Science | Тесты
2.66K subscribers
27 photos
470 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод в машинном обучении используется для балансировки классов в несбалансированных данных?
Anonymous Quiz
12%
K-ближайших соседей (KNN)
7%
Случайный лес
73%
SMOTE
7%
Градиентный бустинг
👍1💊1
🤔 Какой метод используется для балансировки несбалансированных данных?
Anonymous Quiz
89%
SMOTE
8%
PCA
3%
T-SNE
0%
K-means
💊1
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение, используя L2 регуляризацию?
Anonymous Quiz
42%
Lasso Regression
5%
Random Forest
49%
Ridge Regression
4%
K-Means Clustering
🤔 Какой метод машинного обучения используется для обнаружения выбросов путем построения гиперплоскостей, отделяющих аномалии от нормальных данных?
Anonymous Quiz
8%
Линейная регрессия
30%
Изолирующий лес
59%
Метод опорных векторов (SVM)
3%
Логистическая регрессия
🤔 При свёртке картинки HxW матрицей 3x3, что получится в итоге?

Результирующий размер изображения будет (H−2)×(W−2)(H-2) \times (W-2), если не использовать дополнение, так как свёртка "обрезает" края.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения дисперсии в ансамблевом обучении?
Anonymous Quiz
15%
Рандомизация
12%
Аугментация данных
42%
Усреднение
31%
Адаптивный бустинг
🤔 Какой метод используется для снижения размерности данных, учитывающий корреляцию между переменными?
Anonymous Quiz
46%
Главные компоненты
38%
t-SNE
8%
Линейная регрессия
8%
Многомерный масштабирование
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, используя взвешивание слабых моделей?
Anonymous Quiz
33%
Bagging
35%
Boosting
13%
Stacking
20%
Ensemble Learning
💊5🤔1
🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений с заменой?
Anonymous Quiz
41%
Bagging
15%
Boosting
17%
Stacking
26%
Random Forest
🤔 Какие подходы понижения размерности известны?

Основные подходы понижения размерности включают метод главных компонент (PCA), сингулярное разложение (SVD), t-SNE и UMAP. PCA снижает размерность данных, находя новые оси, которые объясняют наибольшую дисперсию данных. t-SNE и UMAP используются для визуализации данных в пространстве низкой размерности, сохраняя их топологическую структуру. Эти методы позволяют уменьшить количество признаков при сохранении важной информации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации временных рядов на основе их циклических паттернов?
Anonymous Quiz
8%
Decision Tree
12%
Логистическая регрессия
71%
Fourier Analysis
9%
Автоэнкодеры
🤔 Какой метод уменьшает дисперсию, используя ансамблевое обучение?
Anonymous Quiz
39%
Boosting
8%
Stacking
41%
Bagging
12%
Ensemble Learning
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто применяют для классификации текстовых данных?
Anonymous Quiz
59%
Naive Bayes
22%
K-means
3%
PCA
16%
Логистическая регрессия
🤔 Какая библиотека используется для манипуляции с таблицами в Python?
Anonymous Quiz
92%
Pandas
7%
NumPy
1%
SciPy
0%
Matplotlib
🤔 Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, нормализуя входные данные в модели?
Anonymous Quiz
12%
Dropout
78%
Batch Normalization
2%
Early Stopping
7%
Cross-Validation