Text Classification: All Tips and Tricks from 5 Kaggle Competitions
https://neptune.ai/blog/text-classification-tips-and-tricks-kaggle-competitions?utm_source=slack&utm_medium=post&utm_campaign=blog-text-classification-tips-and-tricks-kaggle-competitions
https://neptune.ai/blog/text-classification-tips-and-tricks-kaggle-competitions?utm_source=slack&utm_medium=post&utm_campaign=blog-text-classification-tips-and-tricks-kaggle-competitions
neptune.ai
Text Classification: All Tips and Tricks from 5 Kaggle Competitions
In this article, I will discuss some great tips and tricks to improve the performance of your text classification model. These tricks are obtained from solutions of some of Kaggle’s top NLP competitions. Namely, I’ve gone through: and found a ton of great…
Машинное обуние ШАД 2019 https://m.youtube.com/playlist?list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK
Подборка статей(+аннотации к ним) с ICLR от 🤗
https://docs.google.com/document/d/17pnPvWglcerkjFLOn-3Y1lB4MQMO-eVlPXjJUKl8XDw/edit#
https://docs.google.com/document/d/17pnPvWglcerkjFLOn-3Y1lB4MQMO-eVlPXjJUKl8XDw/edit#
Google Docs
ICLR papers
A big update to Papers with Code: now with 2500+ leaderboards and 20,000+ results.
https://www.reddit.com/r/MachineLearning/comments/gfq9kp/pr_a_big_update_to_papers_with_code_now_with_2500/
https://www.reddit.com/r/MachineLearning/comments/gfq9kp/pr_a_big_update_to_papers_with_code_now_with_2500/
reddit
[P][R] A big update to Papers with Code: now with 2500+...
We made a big update to the Papers with Code database of results from papers, now with 2500+ leaderboards and 20,000+ results. You can browse the...
Очередная классная статья на Distill
Exploring Bayesian Optimization
https://distill.pub/2020/bayesian-optimization/
Exploring Bayesian Optimization
https://distill.pub/2020/bayesian-optimization/
Distill
Exploring Bayesian Optimization
How to tune hyperparameters for your machine learning model using Bayesian optimization.
Hugging Face зарелизили 1008 моделей машинного перевода для 140 языков. Огонь!!!!
http://twitter.com/huggingface/status/1260942644286537728
http://twitter.com/huggingface/status/1260942644286537728
Twitter
Hugging Face
Let’s democratize NLP for all languages! 🌎🌎🌎 Today, with v2.9.1, we are releasing 1,008 machine translation models, covering ` of 140 different languages trained by @jorgtiedemann with @marian, ported by @sam_shleifer. Find your language here: https://t.co/9EMtfopij3…
Datasets and evaluation metrics for Natural Language Processing in NumPy, Pandas, PyTorch and TensorFlow
https://github.com/huggingface/nlp
https://github.com/huggingface/nlp
GitHub
GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data…
🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools - GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for...
VisionLabs проводит четвертый ежегодный саммит по искусственному интеллекту, компьютерному зрению и машинному обучению Machines Can See. В этом году саммит пройдет 8-10 июня полностью в онлайн формате. Основная цель мероприятия – создать площадку для общения ведущих мировых ученых с широкой международной аудиторией исследователей и интересующихся темой ИИ.
В рамках саммита Machines Can See 2020 ученые поделятся результатами и актуальными научными идеями в таких лабораториях, как CMU, Georgia Tech, Inria, Facebook, Google, Intel, Samsung и Yandex. Презентации будут посвящены достижениям в трех основных темах - нейронные сети и глубокое обучение для распознавания изображений и видео; Навигация, автономное вождение и робототехника; а также генерация нейронных изображений и анимированные человеческие аватары. После выступления все спикеры поделятся своими идеями на тему будущего ИИ, его развития и пользы для общества в формате дискуссий.
Четвертый саммит MCS 2020 будет проходить полностью в онлайн формате для участия широкой аудитории в период COVID–19. Участие в саммите бесплатное, по регистрации. В программе саммита – научные доклады, онлайн-сессии вопросов и ответов с докладчиками и обсуждения в режиме реального времени.
Регистрация тут: http://machinescansee.com/registration/
В рамках саммита Machines Can See 2020 ученые поделятся результатами и актуальными научными идеями в таких лабораториях, как CMU, Georgia Tech, Inria, Facebook, Google, Intel, Samsung и Yandex. Презентации будут посвящены достижениям в трех основных темах - нейронные сети и глубокое обучение для распознавания изображений и видео; Навигация, автономное вождение и робототехника; а также генерация нейронных изображений и анимированные человеческие аватары. После выступления все спикеры поделятся своими идеями на тему будущего ИИ, его развития и пользы для общества в формате дискуссий.
Четвертый саммит MCS 2020 будет проходить полностью в онлайн формате для участия широкой аудитории в период COVID–19. Участие в саммите бесплатное, по регистрации. В программе саммита – научные доклады, онлайн-сессии вопросов и ответов с докладчиками и обсуждения в режиме реального времени.
Регистрация тут: http://machinescansee.com/registration/
Practitioner’s Guide to Statistical Tests
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
Medium
Practitioner’s Guide to Statistical Tests
Hi, we are Nikita and Daniel from the CoreML team at VK. It’s our job to design and improve recommender systems for friends, music, videos…
Better Data Loading: 20x PyTorch Speed-Up for Tabular Data
https://towardsdatascience.com/better-data-loading-20x-pytorch-speed-up-for-tabular-data-e264b9e34352
https://towardsdatascience.com/better-data-loading-20x-pytorch-speed-up-for-tabular-data-e264b9e34352
Medium
Better Data Loading: 20x PyTorch Speed-Up for Tabular Data
A simple change to speed up your deep learning training massively
Конференция Samsung'a. SAIF 2020 Registration
https://register.saif2020.com/
https://register.saif2020.com/
Как начинающему Data Engineer повысить свою эффективность? Начните прокачивать навыки 12 ноября с демо-занятия «Знакомство с Ni-Fi». Вместе с Егором Матешуком вы рассмотрите Ni-Fi и роль data ingestion инструментов в целом при построении систем обработки данных. Решите простую задачку по построению пайплайна для загрузки файлов в хранилище данных с использованием Ni-Fi.
Демо-урок входит в программу онлайн-курса «Data Engineer». Для записи на вебинар, пройдите вступительный тест https://otus.pw/SUl7/
Демо-урок входит в программу онлайн-курса «Data Engineer». Для записи на вебинар, пройдите вступительный тест https://otus.pw/SUl7/
Аугментация для текстов (Text Augmentation)
https://dyakonov.org/2020/11/09/text-augmentation/
https://dyakonov.org/2020/11/09/text-augmentation/
Анализ малых данных
Аугментация для текстов (Text Augmentation)
Похоже, на русском языке нет полного обзора по современным методам аугментации при работе с текстами, поэтому появился этот… На английском языке есть несколько очень хороших, но здесь удалось…
Гиперпараметры: как перестать беспокоиться и начать их оптимизировать
https://habr.com/ru/company/antiplagiat/blog/528384/
https://habr.com/ru/company/antiplagiat/blog/528384/
Хабр
Гиперпараметры: как перестать беспокоиться и начать их оптимизировать
«Подбор гиперпараметров». Если у вас в голове при произнесении этой фразы прокатились несколько панических атак и непроизвольно задергался глаз, а, возможно, и рука в инстинктивном желании перевернуть...
Yandex.Cloud и AI Community впервые запускает онлайн-соревнование по анализу данных Yet Another Data Challenge. https://bit.ly/3mcgCmj
Развиваешься в ML-разработке и Data Science?
Новичок или есть опыт в Python?
Регистрируйся - участвуй - выигрывай призы!
Этот конкурс для тебя, если тебе интересно:
🟡 проверить свои навыки и получить опыт решения интересной задачи по генеративному ML;
🟡 пообщаться с опытными экспертами из Yandex.Cloud в чате и на вебинарах соревнования;
🟡 создать свою первую генеративную мелодию;
🟡 предложить идею по развитию первой отечественной среды для разработки ML, помогающей быстрее и дешевле создавать ML-решения;
Призы конкурса:
🏆 1 место: MacBook Air 13 дюймов, 512 Гб + грант на DataSphere 150 000 руб;
🏆 2 место: Apple iPhone 12 Pro 6,1 дюйма + грант на DataSphere 100 000 руб;
🏆 3 место: Apple Watch Series 6 размер + грант на DataSphere 50 000 руб;
🏆 Топ-10 участников - награждаются Yandex Станцией Мини;
🏆 200 активных участников получают футболки Yandex.Cloud.
https://bit.ly/3mcgCmj
💥Регистрируйся и участвуй!
Онлайн-конкурс по анализу данных Yet Another Data Challenge
https://bit.ly/3mcgCmj
Развиваешься в ML-разработке и Data Science?
Новичок или есть опыт в Python?
Регистрируйся - участвуй - выигрывай призы!
Этот конкурс для тебя, если тебе интересно:
🟡 проверить свои навыки и получить опыт решения интересной задачи по генеративному ML;
🟡 пообщаться с опытными экспертами из Yandex.Cloud в чате и на вебинарах соревнования;
🟡 создать свою первую генеративную мелодию;
🟡 предложить идею по развитию первой отечественной среды для разработки ML, помогающей быстрее и дешевле создавать ML-решения;
Призы конкурса:
🏆 1 место: MacBook Air 13 дюймов, 512 Гб + грант на DataSphere 150 000 руб;
🏆 2 место: Apple iPhone 12 Pro 6,1 дюйма + грант на DataSphere 100 000 руб;
🏆 3 место: Apple Watch Series 6 размер + грант на DataSphere 50 000 руб;
🏆 Топ-10 участников - награждаются Yandex Станцией Мини;
🏆 200 активных участников получают футболки Yandex.Cloud.
https://bit.ly/3mcgCmj
💥Регистрируйся и участвуй!
Онлайн-конкурс по анализу данных Yet Another Data Challenge
https://bit.ly/3mcgCmj