Data Analyst/Data Scientist — в чём разница?
#DS #DataAnalyst #DataScience #DataScientist #DataAnalysis #BigData #BigDataScience
#DS #DataAnalyst #DataScience #DataScientist #DataAnalysis #BigData #BigDataScience
🗣SMILES: SUMMER SCHOOL OF MACHINE LEARNING - недельный онлайн-интенсив по методам современной статистике и машинному обучению на английском языке от Сколтеха: абсолютно бесплатно и полностью онлайн! Спикеры со всего мира (Нью-Йорк, Тель-Авив, Калифорния, Дармштад) проведут видео-лекции и семинары с практическими заданиями по темам Reinforcement Learning, Robust DL, NLP, Causal inference и другим интересным направлениям Data Science. Регистрация открыта с 26 июня по 26 июля, отобранные участники получат приглашения к 1-му августа 2020 года. Мероприятие пройдет с 16 по 21 августа 2020 года. Успевайте подать заявку на участие! https://smiles.skoltech.ru/
smiles.skoltech.ru
SMILES: summer school of machine learning. 2025
Media is too big
VIEW IN TELEGRAM
Дизайн-студия Артемия Лебедева заявила, что создала «искусственный дизайнерский интеллект» и больше года выдавала его за реального человека. За это время нейросеть якобы разработала больше 20 логотипов для разных заказчиков. Никто из них не знал, что заказ выполнила машина.
Подробнее в видео.
Источник: YouTube канал Артемия Лебедева
Подробнее в видео.
Источник: YouTube канал Артемия Лебедева
👍Уникальная возможность поучаствовать в хакатоне Sigma-Thon 1.0. от HackerEarth!
Data Hackathons — это идеальное поле битвы для начинающих Data Scientist'ов. Организации постоянно ищут различные модели и идеи, чтобы поставлять нужные продукты в нужное время. Розничная торговля является одной из таких отраслей.
Что необходимо сделать: создать data-driven решение для предприятий розничной торговли, чтобы обновить свои каналы розничной торговли с помощью моделей данных, механизмов рекомендаций и многого другого. Можно участвовать командой до 4-х человек.
Дедлайн подачи заявок и решений: 12 июля, 2020
Ссылка: https://www.hackerearth.com/ru/challenges/hackathon/sigma-thon-v1/#overview
Data Hackathons — это идеальное поле битвы для начинающих Data Scientist'ов. Организации постоянно ищут различные модели и идеи, чтобы поставлять нужные продукты в нужное время. Розничная торговля является одной из таких отраслей.
Что необходимо сделать: создать data-driven решение для предприятий розничной торговли, чтобы обновить свои каналы розничной торговли с помощью моделей данных, механизмов рекомендаций и многого другого. Можно участвовать командой до 4-х человек.
Дедлайн подачи заявок и решений: 12 июля, 2020
Ссылка: https://www.hackerearth.com/ru/challenges/hackathon/sigma-thon-v1/#overview
This media is not supported in your browser
VIEW IN TELEGRAM
🎞Лучшая подборка видео о Machine Learning:
1. Введение в машинное обучение — https://youtu.be/ukzFI9rgwfU
2. Базовые знания об обработке естественного языка (Natural language processing) — https://youtu.be/d4gGtcobq8M
3. О работе компьютерного зрения — https://www.youtube.com/watch?v=OcycT1Jwsns&feature=youtu.be
4. Многоагентная система (Multi-agent) игры в прятки — https://youtu.be/kopoLzvh5jY
5. Машинное обучение видеоигр — https://youtu.be/qv6UVOQ0F44
Приятного просмотра!
1. Введение в машинное обучение — https://youtu.be/ukzFI9rgwfU
2. Базовые знания об обработке естественного языка (Natural language processing) — https://youtu.be/d4gGtcobq8M
3. О работе компьютерного зрения — https://www.youtube.com/watch?v=OcycT1Jwsns&feature=youtu.be
4. Многоагентная система (Multi-agent) игры в прятки — https://youtu.be/kopoLzvh5jY
5. Машинное обучение видеоигр — https://youtu.be/qv6UVOQ0F44
Приятного просмотра!
SimCLR - простая база для сравнительного обучения (одно из направлений самообучения) визуальным представлениям.
Результаты, описанные в этой статье, могут быть использованы для повышения точности в любом приложении компьютерного зрения, где намного дороже и труднее маркировать дополнительные данные, нежели обучать большие модели.
Github: https://github.com/google-research/simclr
Статья: https://arxiv.org/abs/2006.10029
Результаты, описанные в этой статье, могут быть использованы для повышения точности в любом приложении компьютерного зрения, где намного дороже и труднее маркировать дополнительные данные, нежели обучать большие модели.
Github: https://github.com/google-research/simclr
Статья: https://arxiv.org/abs/2006.10029
GitHub
GitHub - google-research/simclr: SimCLRv2 - Big Self-Supervised Models are Strong Semi-Supervised Learners
SimCLRv2 - Big Self-Supervised Models are Strong Semi-Supervised Learners - google-research/simclr
LeanDS — канал об управлении проектами и продуктами в Data Science
@LeanDS — канал сообщества LeanDS. Коллеги проводят бесплатные митапы по методам управления в Data Science, публикуют статьи и видео.
Если вам интересна тема менеджмента в DS, вы хотите знать, как применять Agile/Scrum в DS и задумывались над тем, как сделать создание ML продуктов более эффективным — присоединяйтесь.
@LeanDS — канал сообщества LeanDS. Коллеги проводят бесплатные митапы по методам управления в Data Science, публикуют статьи и видео.
Если вам интересна тема менеджмента в DS, вы хотите знать, как применять Agile/Scrum в DS и задумывались над тем, как сделать создание ML продуктов более эффективным — присоединяйтесь.
7 лучших фреймворков AutoML в 2020 году
Предположим, есть набор данных, по которому мы хотим получить прогнозную модель. Традиционный подход к машинному обучению требует следующей последовательности действий:
⁃ предварительная обработка данных;
⁃ определение характерных особенностей построения новых функций;
⁃ выбор правильной модели обучения;
⁃ оптимизация гиперпараметров;
⁃ тренировка с оптимальными параметрами.
Процесс может быть долгим и, следовательно, дорогим. Действительно, для лучшего результата необходимо многократно проверять гипотезу, более того, на каждом шаге она может уточняться дальше.
Задача автоматического машинного обучения (AutoML) состоит в том, чтобы автоматизировать все или хотя бы некоторые из этих шагов без потери точности прогнозирования. Идеальная стратегия AutoML предполагает, что любой пользователь может брать необработанные данные, строить на них модель и получать прогнозы с максимально возможной (для доступной выборки) точностью.
Лучшие фреймворки собрали для вас:
1. MLBox хорошо решает следующие задачи:
⁃ Подготовка данных (самая развитая часть библиотеки)
⁃ Выбор модели
⁃ Поиск гиперпараметров
2. Auto Sklearn Framework построен на основе популярной библиотеки машинного обучения scikit-learn. Что может он может делать:
⁃ Выбор модели
⁃ Гипер Настройки
3. TPOT позиционируется как структура, в которой пайплайн машинного обучения полностью автоматизирован. Много различных моделей строятся с выбором лучших в прогнозирующей точности.
4. H2O AutoML поддерживает как традиционные модели машинного обучения, так и нейронные сети. Особенно подходит для тех, кто ищет способ автоматизировать глубокое обучение.
5. Auto Keras использует классический API, как в scikit-learn, но при этом использует мощный поиск нейронной сети для параметров модели с использованием Keras.
6. Cloud AutoML использует архитектуру нейронной сети. Этот продукт Google имеет простой пользовательский интерфейс для изучения и развертывания моделей.
7. Auto-WEKA представляет собой пакет множества различных алгоритмов машинного обучения с открытым исходным кодом. Однако каждый из этих алгоритмов имеет свои собственные гиперпараметры, которые могут радикально изменить их производительность. Auto-WEKA рассматривает проблему одновременного выбора алгоритма обучения и установки его гиперпараметров, выходя за рамки предыдущих методов, которые решают эти проблемы изолированно, и использует полностью автоматизированный подход.
Предположим, есть набор данных, по которому мы хотим получить прогнозную модель. Традиционный подход к машинному обучению требует следующей последовательности действий:
⁃ предварительная обработка данных;
⁃ определение характерных особенностей построения новых функций;
⁃ выбор правильной модели обучения;
⁃ оптимизация гиперпараметров;
⁃ тренировка с оптимальными параметрами.
Процесс может быть долгим и, следовательно, дорогим. Действительно, для лучшего результата необходимо многократно проверять гипотезу, более того, на каждом шаге она может уточняться дальше.
Задача автоматического машинного обучения (AutoML) состоит в том, чтобы автоматизировать все или хотя бы некоторые из этих шагов без потери точности прогнозирования. Идеальная стратегия AutoML предполагает, что любой пользователь может брать необработанные данные, строить на них модель и получать прогнозы с максимально возможной (для доступной выборки) точностью.
Лучшие фреймворки собрали для вас:
1. MLBox хорошо решает следующие задачи:
⁃ Подготовка данных (самая развитая часть библиотеки)
⁃ Выбор модели
⁃ Поиск гиперпараметров
2. Auto Sklearn Framework построен на основе популярной библиотеки машинного обучения scikit-learn. Что может он может делать:
⁃ Выбор модели
⁃ Гипер Настройки
3. TPOT позиционируется как структура, в которой пайплайн машинного обучения полностью автоматизирован. Много различных моделей строятся с выбором лучших в прогнозирующей точности.
4. H2O AutoML поддерживает как традиционные модели машинного обучения, так и нейронные сети. Особенно подходит для тех, кто ищет способ автоматизировать глубокое обучение.
5. Auto Keras использует классический API, как в scikit-learn, но при этом использует мощный поиск нейронной сети для параметров модели с использованием Keras.
6. Cloud AutoML использует архитектуру нейронной сети. Этот продукт Google имеет простой пользовательский интерфейс для изучения и развертывания моделей.
7. Auto-WEKA представляет собой пакет множества различных алгоритмов машинного обучения с открытым исходным кодом. Однако каждый из этих алгоритмов имеет свои собственные гиперпараметры, которые могут радикально изменить их производительность. Auto-WEKA рассматривает проблему одновременного выбора алгоритма обучения и установки его гиперпараметров, выходя за рамки предыдущих методов, которые решают эти проблемы изолированно, и использует полностью автоматизированный подход.
This media is not supported in your browser
VIEW IN TELEGRAM
❤️Полный мэтч: машинное обучение в дейтинге
Сайты знакомств и дейтинговые приложения – одни из самых интересных и в тоже время абсолютно типичных применений современных алгоритмов машинного обучения. В этой статье рассмотрены основные задачи и принципы работы дейтинговых систем с точки зрения Data Science, а также приведены оригинальные примеры пользовательских попыток «хакнуть».
Ссылка на статью:
https://chernobrovov.ru/articles/polnyj-metch-mashinnoe-obuchenie-v-dejtinge.html
Сайты знакомств и дейтинговые приложения – одни из самых интересных и в тоже время абсолютно типичных применений современных алгоритмов машинного обучения. В этой статье рассмотрены основные задачи и принципы работы дейтинговых систем с точки зрения Data Science, а также приведены оригинальные примеры пользовательских попыток «хакнуть».
Ссылка на статью:
https://chernobrovov.ru/articles/polnyj-metch-mashinnoe-obuchenie-v-dejtinge.html
☄️BREAK INTO NLP
Еще одно классное (бесплатное!) онлайн-мероприятие, организованное deeplearning.ai, с участием выдающихся экспертов по NLP, которые поделятся своими мыслями о текущих тенденциях и применениях NLP.
Событие будет транслироваться на YouTube с 20:00 до 21:30 по московскому времени 29 июля. Если вы не сможете посмотреть вживую, обязательно зарегистрируйтесь, чтобы получить ссылку для записи.
Ссылка на событие и регистрацию — Break into NLP.
Всем продуктивных выходных!
Еще одно классное (бесплатное!) онлайн-мероприятие, организованное deeplearning.ai, с участием выдающихся экспертов по NLP, которые поделятся своими мыслями о текущих тенденциях и применениях NLP.
Событие будет транслироваться на YouTube с 20:00 до 21:30 по московскому времени 29 июля. Если вы не сможете посмотреть вживую, обязательно зарегистрируйтесь, чтобы получить ссылку для записи.
Ссылка на событие и регистрацию — Break into NLP.
Всем продуктивных выходных!
Eventbrite
Break into Natural Language Processing
An online event hosted by deeplearning.ai featuring distinguished NLP experts sharing their thoughts on current NLP trend and applications.
Релиз TensorFlow 2.3.0!!!
https://blog.tensorflow.org/2020/07/whats-new-in-tensorflow-2-3.html
Релиз : https://github.com/tensorflow/tensorflow/releases
https://blog.tensorflow.org/2020/07/whats-new-in-tensorflow-2-3.html
Релиз : https://github.com/tensorflow/tensorflow/releases
blog.tensorflow.org
What's new in TensorFlow 2.3?
TensorFlow 2.3 has been released with new tools to make it easier to load and preprocess data, and solve input-pipeline bottlenecks.
Forwarded from Karim Iskakov - канал (Vladimir Ivashkin)
This media is not supported in your browser
VIEW IN TELEGRAM
BREAKING NEWS! (sound on)
Our iOS app Avatarify is #1 in Russian App Store, and today we release it worldwide.
Vivify any photo with your face in real time: celebrity, your boss or even pet. Record video and share it to amaze your friends.
NN works completely on the device in zero-shot mode. Check it out!
📱 App Store
🌐 avatarify.ai
📉 @loss_function_porn
Our iOS app Avatarify is #1 in Russian App Store, and today we release it worldwide.
Vivify any photo with your face in real time: celebrity, your boss or even pet. Record video and share it to amaze your friends.
NN works completely on the device in zero-shot mode. Check it out!
📱 App Store
🌐 avatarify.ai
📉 @loss_function_porn
🇷🇺Россия, вперед! Согласно исследованию Coursera, наша страна возглавила мировой рейтинг по компетенциям в области технологий и Data Science. Наиболее сильные компетенции показали студенты ВУЗов Москвы, Петербурга, Томска и Новосибирска.
Coursera
Global Skills Report 2025 | Coursera
Download Coursera’s Global Skills Report 2025 to explore ...
💰После выхода выпуска у Дудя про Кремниевую Долину наверняка каждый подумал о том, как бы туда попасть.
Предлагаем посмотреть довольно интересную статью про детальный разбор структуры зарплат IT-специалистов в Кремниевой долине, а также на то, сколько в совокупности можно было бы получать в год в топовых компаниях США.
https://habr.com/ru/post/512598/
Хорошая мотивация?
Предлагаем посмотреть довольно интересную статью про детальный разбор структуры зарплат IT-специалистов в Кремниевой долине, а также на то, сколько в совокупности можно было бы получать в год в топовых компаниях США.
https://habr.com/ru/post/512598/
Хорошая мотивация?
Хабр
Детальный разбор структуры зарплат IT-специалистов в Кремниевой Долине
О чем пойдет речь В рамках пятничного безумия, давайте представим, что у Вас волшебным образом появилось разрешение на работу в США, и Вы уже готовы после завтрака телепортироваться в самый центр...
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Netflix’s Polynote is a New Open Source Framework to Build Better Data Science Notebooks
Polynote is an experimental polyglot notebook environment. Currently, it supports Scala and Python, SQL, and Vega.
https://www.kdnuggets.com/2020/08/netflix-polynote-open-source-framework-better-data-science-notebooks.html
Project page: https://polynote.org/
Github: https://github.com/polynote/polynote
@ai_machinelearning_big_data
Polynote is an experimental polyglot notebook environment. Currently, it supports Scala and Python, SQL, and Vega.
https://www.kdnuggets.com/2020/08/netflix-polynote-open-source-framework-better-data-science-notebooks.html
Project page: https://polynote.org/
Github: https://github.com/polynote/polynote
@ai_machinelearning_big_data
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть GPT-3 от OpenAI пишет стихи, музыку и код.
Алгоритм выдаёт текст, который лишь кажется осмысленным, и на самом деле просто связывает уже созданные людьми данные.
В мае 2020 года OpenAI представила третью версию языковой модели GPT, которая позволяет генерировать текст, который не всегда можно отличить от того, что написал бы человек.
GPT-3 генерирует текст на основе 175 миллиардов параметров — это значение отражает её вычислительную мощность. В зависимости от количества параметров система лучше или хуже оценивает данные и придаёт каким-то из них большее значение, а каким-то меньшее.
GPT-3 нельзя(!) cвободно использовать: пока OpenAI даёт доступ только отдельным разработчикам и исследователям в рамках закрытого бета-теста :(
Алгоритм выдаёт текст, который лишь кажется осмысленным, и на самом деле просто связывает уже созданные людьми данные.
В мае 2020 года OpenAI представила третью версию языковой модели GPT, которая позволяет генерировать текст, который не всегда можно отличить от того, что написал бы человек.
GPT-3 генерирует текст на основе 175 миллиардов параметров — это значение отражает её вычислительную мощность. В зависимости от количества параметров система лучше или хуже оценивает данные и придаёт каким-то из них большее значение, а каким-то меньшее.
GPT-3 нельзя(!) cвободно использовать: пока OpenAI даёт доступ только отдельным разработчикам и исследователям в рамках закрытого бета-теста :(
⚙️Что же такое QA и как овладеть профессией тестировщика ПО,чтобы реализовать себя в IT-отрасли?
Советуем обратить внимание на канал про радости и боли, преподавание и рефлексию на тему работы в IT, который ведёт Анастасия Шарикова, QA Lead в Bookmate.
И если вам также интересна тема тестинга, или вы хотите узнать больше классных вещей из мира Data Science, которые с каждым годом только развиваются, то делимся ссылкой на канал - https://news.1rj.ru/str/yetanotherqa
Советуем обратить внимание на канал про радости и боли, преподавание и рефлексию на тему работы в IT, который ведёт Анастасия Шарикова, QA Lead в Bookmate.
И если вам также интересна тема тестинга, или вы хотите узнать больше классных вещей из мира Data Science, которые с каждым годом только развиваются, то делимся ссылкой на канал - https://news.1rj.ru/str/yetanotherqa
Mail.ru Group и hh.ru составили портреты российских специалистов по анализу данных (Data Science) и машинному обучению (Machine Learning). Аналитики выяснили, где они живут и что умеют — а также чего ждут от них работодатели и как меняется спрос на таких профессионалов.
https://habr.com/ru/company/mailru/blog/511104/
https://habr.com/ru/company/mailru/blog/511104/
💡В обучающей программе Learn with Google AI имеются бесплатные уроки Machine Learning Crash Course (MLCC). Курс помогает освоить машинное обучение и раньше был доступен только сотрудникам компании.
Раздел обучающей программы Learn with Google AI состоит из 25 уроков с более чем 40 заданиями. Лекции ведут исследователи из Google, объясняя принципы машинного обучения на реальных примерах. Прохождение всего курса занимает 15 часов.
Проведите свою неделю продуктивно - https://developers.google.com/machine-learning/crash-course
Раздел обучающей программы Learn with Google AI состоит из 25 уроков с более чем 40 заданиями. Лекции ведут исследователи из Google, объясняя принципы машинного обучения на реальных примерах. Прохождение всего курса занимает 15 часов.
Проведите свою неделю продуктивно - https://developers.google.com/machine-learning/crash-course
Google AI
Understanding AI: AI tools, training, and skills
Google offers various AI-powered programs, training, and tools to help advance your skills. Develop AI skills and view available resources.
🧐Philosopher AI
Представленный недавно исследовательской организацией OpenAI генератор текста GPT-3 стал одной из самых обсуждаемых тем в сфере искусственного интеллекта (ИИ) за последнее время. Этот алгоритм может «умно» отвечать на многие вопросы, сочинять стихи, новостные статьи и финансовые отчеты и даже писать программный код. Предлагаем попробовать и вам.
Веб-сайт: https://philosopherai.com/philosopher/humanity-on-mars-73ac00
Представленный недавно исследовательской организацией OpenAI генератор текста GPT-3 стал одной из самых обсуждаемых тем в сфере искусственного интеллекта (ИИ) за последнее время. Этот алгоритм может «умно» отвечать на многие вопросы, сочинять стихи, новостные статьи и финансовые отчеты и даже писать программный код. Предлагаем попробовать и вам.
Веб-сайт: https://philosopherai.com/philosopher/humanity-on-mars-73ac00