A big update to Papers with Code: now with 2500+ leaderboards and 20,000+ results.
https://www.reddit.com/r/MachineLearning/comments/gfq9kp/pr_a_big_update_to_papers_with_code_now_with_2500/
https://www.reddit.com/r/MachineLearning/comments/gfq9kp/pr_a_big_update_to_papers_with_code_now_with_2500/
reddit
[P][R] A big update to Papers with Code: now with 2500+...
We made a big update to the Papers with Code database of results from papers, now with 2500+ leaderboards and 20,000+ results. You can browse the...
Очередная классная статья на Distill
Exploring Bayesian Optimization
https://distill.pub/2020/bayesian-optimization/
Exploring Bayesian Optimization
https://distill.pub/2020/bayesian-optimization/
Distill
Exploring Bayesian Optimization
How to tune hyperparameters for your machine learning model using Bayesian optimization.
Hugging Face зарелизили 1008 моделей машинного перевода для 140 языков. Огонь!!!!
http://twitter.com/huggingface/status/1260942644286537728
http://twitter.com/huggingface/status/1260942644286537728
Twitter
Hugging Face
Let’s democratize NLP for all languages! 🌎🌎🌎 Today, with v2.9.1, we are releasing 1,008 machine translation models, covering ` of 140 different languages trained by @jorgtiedemann with @marian, ported by @sam_shleifer. Find your language here: https://t.co/9EMtfopij3…
Datasets and evaluation metrics for Natural Language Processing in NumPy, Pandas, PyTorch and TensorFlow
https://github.com/huggingface/nlp
https://github.com/huggingface/nlp
GitHub
GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data…
🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools - GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for...
VisionLabs проводит четвертый ежегодный саммит по искусственному интеллекту, компьютерному зрению и машинному обучению Machines Can See. В этом году саммит пройдет 8-10 июня полностью в онлайн формате. Основная цель мероприятия – создать площадку для общения ведущих мировых ученых с широкой международной аудиторией исследователей и интересующихся темой ИИ.
В рамках саммита Machines Can See 2020 ученые поделятся результатами и актуальными научными идеями в таких лабораториях, как CMU, Georgia Tech, Inria, Facebook, Google, Intel, Samsung и Yandex. Презентации будут посвящены достижениям в трех основных темах - нейронные сети и глубокое обучение для распознавания изображений и видео; Навигация, автономное вождение и робототехника; а также генерация нейронных изображений и анимированные человеческие аватары. После выступления все спикеры поделятся своими идеями на тему будущего ИИ, его развития и пользы для общества в формате дискуссий.
Четвертый саммит MCS 2020 будет проходить полностью в онлайн формате для участия широкой аудитории в период COVID–19. Участие в саммите бесплатное, по регистрации. В программе саммита – научные доклады, онлайн-сессии вопросов и ответов с докладчиками и обсуждения в режиме реального времени.
Регистрация тут: http://machinescansee.com/registration/
В рамках саммита Machines Can See 2020 ученые поделятся результатами и актуальными научными идеями в таких лабораториях, как CMU, Georgia Tech, Inria, Facebook, Google, Intel, Samsung и Yandex. Презентации будут посвящены достижениям в трех основных темах - нейронные сети и глубокое обучение для распознавания изображений и видео; Навигация, автономное вождение и робототехника; а также генерация нейронных изображений и анимированные человеческие аватары. После выступления все спикеры поделятся своими идеями на тему будущего ИИ, его развития и пользы для общества в формате дискуссий.
Четвертый саммит MCS 2020 будет проходить полностью в онлайн формате для участия широкой аудитории в период COVID–19. Участие в саммите бесплатное, по регистрации. В программе саммита – научные доклады, онлайн-сессии вопросов и ответов с докладчиками и обсуждения в режиме реального времени.
Регистрация тут: http://machinescansee.com/registration/
Practitioner’s Guide to Statistical Tests
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
https://medium.com/@vktech/practitioners-guide-to-statistical-tests-ed2d580ef04f
Medium
Practitioner’s Guide to Statistical Tests
Hi, we are Nikita and Daniel from the CoreML team at VK. It’s our job to design and improve recommender systems for friends, music, videos…
Better Data Loading: 20x PyTorch Speed-Up for Tabular Data
https://towardsdatascience.com/better-data-loading-20x-pytorch-speed-up-for-tabular-data-e264b9e34352
https://towardsdatascience.com/better-data-loading-20x-pytorch-speed-up-for-tabular-data-e264b9e34352
Medium
Better Data Loading: 20x PyTorch Speed-Up for Tabular Data
A simple change to speed up your deep learning training massively
Конференция Samsung'a. SAIF 2020 Registration
https://register.saif2020.com/
https://register.saif2020.com/
Как начинающему Data Engineer повысить свою эффективность? Начните прокачивать навыки 12 ноября с демо-занятия «Знакомство с Ni-Fi». Вместе с Егором Матешуком вы рассмотрите Ni-Fi и роль data ingestion инструментов в целом при построении систем обработки данных. Решите простую задачку по построению пайплайна для загрузки файлов в хранилище данных с использованием Ni-Fi.
Демо-урок входит в программу онлайн-курса «Data Engineer». Для записи на вебинар, пройдите вступительный тест https://otus.pw/SUl7/
Демо-урок входит в программу онлайн-курса «Data Engineer». Для записи на вебинар, пройдите вступительный тест https://otus.pw/SUl7/
Аугментация для текстов (Text Augmentation)
https://dyakonov.org/2020/11/09/text-augmentation/
https://dyakonov.org/2020/11/09/text-augmentation/
Анализ малых данных
Аугментация для текстов (Text Augmentation)
Похоже, на русском языке нет полного обзора по современным методам аугментации при работе с текстами, поэтому появился этот… На английском языке есть несколько очень хороших, но здесь удалось…
Гиперпараметры: как перестать беспокоиться и начать их оптимизировать
https://habr.com/ru/company/antiplagiat/blog/528384/
https://habr.com/ru/company/antiplagiat/blog/528384/
Хабр
Гиперпараметры: как перестать беспокоиться и начать их оптимизировать
«Подбор гиперпараметров». Если у вас в голове при произнесении этой фразы прокатились несколько панических атак и непроизвольно задергался глаз, а, возможно, и рука в инстинктивном желании перевернуть...
Yandex.Cloud и AI Community впервые запускает онлайн-соревнование по анализу данных Yet Another Data Challenge. https://bit.ly/3mcgCmj
Развиваешься в ML-разработке и Data Science?
Новичок или есть опыт в Python?
Регистрируйся - участвуй - выигрывай призы!
Этот конкурс для тебя, если тебе интересно:
🟡 проверить свои навыки и получить опыт решения интересной задачи по генеративному ML;
🟡 пообщаться с опытными экспертами из Yandex.Cloud в чате и на вебинарах соревнования;
🟡 создать свою первую генеративную мелодию;
🟡 предложить идею по развитию первой отечественной среды для разработки ML, помогающей быстрее и дешевле создавать ML-решения;
Призы конкурса:
🏆 1 место: MacBook Air 13 дюймов, 512 Гб + грант на DataSphere 150 000 руб;
🏆 2 место: Apple iPhone 12 Pro 6,1 дюйма + грант на DataSphere 100 000 руб;
🏆 3 место: Apple Watch Series 6 размер + грант на DataSphere 50 000 руб;
🏆 Топ-10 участников - награждаются Yandex Станцией Мини;
🏆 200 активных участников получают футболки Yandex.Cloud.
https://bit.ly/3mcgCmj
💥Регистрируйся и участвуй!
Онлайн-конкурс по анализу данных Yet Another Data Challenge
https://bit.ly/3mcgCmj
Развиваешься в ML-разработке и Data Science?
Новичок или есть опыт в Python?
Регистрируйся - участвуй - выигрывай призы!
Этот конкурс для тебя, если тебе интересно:
🟡 проверить свои навыки и получить опыт решения интересной задачи по генеративному ML;
🟡 пообщаться с опытными экспертами из Yandex.Cloud в чате и на вебинарах соревнования;
🟡 создать свою первую генеративную мелодию;
🟡 предложить идею по развитию первой отечественной среды для разработки ML, помогающей быстрее и дешевле создавать ML-решения;
Призы конкурса:
🏆 1 место: MacBook Air 13 дюймов, 512 Гб + грант на DataSphere 150 000 руб;
🏆 2 место: Apple iPhone 12 Pro 6,1 дюйма + грант на DataSphere 100 000 руб;
🏆 3 место: Apple Watch Series 6 размер + грант на DataSphere 50 000 руб;
🏆 Топ-10 участников - награждаются Yandex Станцией Мини;
🏆 200 активных участников получают футболки Yandex.Cloud.
https://bit.ly/3mcgCmj
💥Регистрируйся и участвуй!
Онлайн-конкурс по анализу данных Yet Another Data Challenge
https://bit.ly/3mcgCmj
Forwarded from Small Data Science for Russian Adventurers
Анализ малых данных
курс «Прикладные задачи анализа данных»
На сайте появилась новая вкладка «Курсы», а главное, выложены материалы этого года (слайды и видео) курса ПЗАД, который читается для студентов ВМК МГУ, а ниже немного об истории курса.…
Forwarded from Small Data Science for Russian Adventurers
#книга
Сергей Иванов (один из моих лучших аспирантов) написал очень симпатичный конспект по теме "Обучение с подкреплением". Вроде как на русском языке это самое полное и интересное издание на эту тему:
https://github.com/FortsAndMills/RL-Theory-book/
Сергей Иванов (один из моих лучших аспирантов) написал очень симпатичный конспект по теме "Обучение с подкреплением". Вроде как на русском языке это самое полное и интересное издание на эту тему:
https://github.com/FortsAndMills/RL-Theory-book/
GitHub
GitHub - FortsAndMills/RL-Theory-book: Reinforcement learning theory book about foundations of deep RL algorithms with proofs.
Reinforcement learning theory book about foundations of deep RL algorithms with proofs. - FortsAndMills/RL-Theory-book
Forwarded from Small Data Science for Russian Adventurers
#образование
Хороший курс для начинающих по DL:
“Методы обработки и анализа больших данных”
(читался для МИЭТ). Автор - доктор технических наук Роман Соловьёв, известен на Kaggle под ником ZFTurbo (победами на кегле и на других платформах). Очень приятно читает, все лекции продуманы, примеры из своей практики. Правда, курс маленький и не все темы раскрыты достаточно подробно. Где-то, наверное, есть ещё ноутбуки автора (примеры показанные на лекции очень хорошо написаны).
https://youtube.com/playlist?list=PLMyPRULSXkaWaJrQOWCBw0nVVVydPsPPj
Хороший курс для начинающих по DL:
“Методы обработки и анализа больших данных”
(читался для МИЭТ). Автор - доктор технических наук Роман Соловьёв, известен на Kaggle под ником ZFTurbo (победами на кегле и на других платформах). Очень приятно читает, все лекции продуманы, примеры из своей практики. Правда, курс маленький и не все темы раскрыты достаточно подробно. Где-то, наверное, есть ещё ноутбуки автора (примеры показанные на лекции очень хорошо написаны).
https://youtube.com/playlist?list=PLMyPRULSXkaWaJrQOWCBw0nVVVydPsPPj
Forwarded from DL in NLP (nlpcontroller_bot)
Наткнулся на мини-библиотеку для машинного перевода.
Всё, что она умеет, это использовать несколько предобученных моделей, но в этой простоте и вся красота. Поддерживается более 150 языков, включая русский, также есть автодетекция языка. Делает всё локально и позволяет выбирать между несколькими моделями и тюнить beam size.
Для установки:
Для использования:
Всё, что она умеет, это использовать несколько предобученных моделей, но в этой простоте и вся красота. Поддерживается более 150 языков, включая русский, также есть автодетекция языка. Делает всё локально и позволяет выбирать между несколькими моделями и тюнить beam size.
Для установки:
pip install easynmtДля использования:
from easynmt import EasyNMT
model = EasyNMT('opus-mt')
model.translate('переведи мне это предложение', target_lang='en')
GitHub
GitHub - UKPLab/EasyNMT: Easy to use, state-of-the-art Neural Machine Translation for 100+ languages
Easy to use, state-of-the-art Neural Machine Translation for 100+ languages - UKPLab/EasyNMT