#top@datamining.team
Команда Data Mining предлагает вам ознакомиться с ТОП-5 постами за октябрь:
1) 4 библиотеки Python, которые помогут вам зарабатывать деньги на веб-скрейпинге.
https://vk.com/wall-94208167_4792
2) Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ.
https://vk.com/wall-94208167_4822
3) Готовая библиотека для аугментаций в NLP.
https://vk.com/wall-94208167_4837
4) Топ-13 навыков, чтобы стать успешным аналитиком данных.
https://vk.com/wall-94208167_4839
5) Возможно, лучшая визуализация того, как работает трансформер. Во всех примерах визуализировано в том числе и батч-измерение.
https://vk.com/wall-94208167_4823
Команда Data Mining предлагает вам ознакомиться с ТОП-5 постами за октябрь:
1) 4 библиотеки Python, которые помогут вам зарабатывать деньги на веб-скрейпинге.
https://vk.com/wall-94208167_4792
2) Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ.
https://vk.com/wall-94208167_4822
3) Готовая библиотека для аугментаций в NLP.
https://vk.com/wall-94208167_4837
4) Топ-13 навыков, чтобы стать успешным аналитиком данных.
https://vk.com/wall-94208167_4839
5) Возможно, лучшая визуализация того, как работает трансформер. Во всех примерах визуализировано в том числе и батч-измерение.
https://vk.com/wall-94208167_4823
Мы подобрали для вас несколько курсов, благодаря которым вы можете обучиться Data science:
Coursera - типовые задачи машинного обучения и анализа данных и методы их решения - (https://bit.ly/2GrDNdy)
HarvarDX - создайте основу для R и узнайте, как обрабатывать, анализировать и визуализировать данные (https://bit.ly/3oUip1O)
IBM - этот курс Python представляет собой удобное введение для новичков в Python для науки о данных. (https://bit.ly/3jVja70)
OpenEdu - В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей. (https://bit.ly/2I03IJP)
Stepik - курс знакомит слушателей с основами машинного обучения и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Data Science. (https://bit.ly/32aHXxX)
Codebasics (Youtube) - это полный курс по науке о данных, который может пройти любой новичок, чтобы изучить науку о данных. Он охватывает огромное количество тем. (https://bit.ly/3kXanmo)
Coursera - типовые задачи машинного обучения и анализа данных и методы их решения - (https://bit.ly/2GrDNdy)
HarvarDX - создайте основу для R и узнайте, как обрабатывать, анализировать и визуализировать данные (https://bit.ly/3oUip1O)
IBM - этот курс Python представляет собой удобное введение для новичков в Python для науки о данных. (https://bit.ly/3jVja70)
OpenEdu - В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей. (https://bit.ly/2I03IJP)
Stepik - курс знакомит слушателей с основами машинного обучения и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Data Science. (https://bit.ly/32aHXxX)
Codebasics (Youtube) - это полный курс по науке о данных, который может пройти любой новичок, чтобы изучить науку о данных. Он охватывает огромное количество тем. (https://bit.ly/3kXanmo)
Текстовый анализ сообщений в социальных сетях показывает, что среди других негативных тенденций растет беспокойство пользователей и уровень суицидального риска.
https://bit.ly/3k5BkmE
https://bit.ly/3k5BkmE
Модели на основе остаточной энергии для генерации текста.
Новая интересная статья по генерации текста. Авторы предлагают вместо стандартного авторегрессионного моделирования перейти к моделированию ненормализованной вероятности (энергии) целого предложения.
https://bit.ly/3eHekcE
Новая интересная статья по генерации текста. Авторы предлагают вместо стандартного авторегрессионного моделирования перейти к моделированию ненормализованной вероятности (энергии) целого предложения.
https://bit.ly/3eHekcE
Полный обзор по современным методам аугментации при работе с текстами на русском языке.
https://bit.ly/3lpZAl4
https://bit.ly/3lpZAl4
Эффективные датасэты с открытым доступом в PyTorch, TensorFlow, NumPy и Pandas.
https://bit.ly/3pnx8mh
https://bit.ly/3pnx8mh
Развитие искусственного может позволить использовать его в бытовой технике, одновременно повышая безопасность данных и энергоэффективность.
https://bit.ly/2UsnFvM
https://bit.ly/2UsnFvM
Из каких профессий люди приходят в Data Science, как они выбрали обучение, чего стремятся достичь, где собираются работать и какую роль сыграла пандемия.
https://bit.ly/3ff7FXC
https://bit.ly/3ff7FXC
Подборка правильных шпаргалок (cheatsheet) по R, python, SQL и анализу данных.
https://bit.ly/3lK5764
https://bit.ly/3lK5764
Facebook выложили мультиязычную модель, которая по их заявлениям позволяет напрямую, без промежуточного языка, переводить 100x100 языковых пар.
Ссылка на гитхаб библиотеку: https://bit.ly/36NzFgZ
Ссылка на гитхаб библиотеку: https://bit.ly/36NzFgZ
Цветовые шкалы - это все в визуализации данных - эффективно ли вы их используете?
https://bit.ly/38Z6daw
https://bit.ly/38Z6daw