Мы подготовили для вас порцию полезной практики 💪.
По ЭТОЙ ССЫЛКЕ можно скачать инструкцию, где на простом примере (прогнозе погоды) описаны шаги:
👉 как с помощью простых скриптов на Python получить реальные данные через API
👉 как преобразовать данные из формата JSON в нужный для нас
👉 как сохранить полученные данные в BigQuery
👉 как использовать эти данные для Machine Learning
Обязательно попробуйте это проделать самостоятельно - каждый маленький практический шаг приведет вас к большой победе. Мы поможем вам еще больше полюбить Data Science и Machine Learning 😉.
По ЭТОЙ ССЫЛКЕ можно скачать инструкцию, где на простом примере (прогнозе погоды) описаны шаги:
👉 как с помощью простых скриптов на Python получить реальные данные через API
👉 как преобразовать данные из формата JSON в нужный для нас
👉 как сохранить полученные данные в BigQuery
👉 как использовать эти данные для Machine Learning
Обязательно попробуйте это проделать самостоятельно - каждый маленький практический шаг приведет вас к большой победе. Мы поможем вам еще больше полюбить Data Science и Machine Learning 😉.
❤16👍7🔥1
Предлагаем рассмотреть несколько алгоритмов поиска выбросов, проведём первичное сравнение на различных датасетах и определим несколько наиболее оптимальных из них.
Выбросы (или аномалии) в статистике — результаты измерения, выделяющиеся из общей выборки. Обнаружение выбросов важно во многих областях и процессах. В электронике поиск выбросов может помочь при обнаружении неисправных устройств. В банковских операциях поиск выбросов может помочь при обнаружении нетипичных для клиента операций. Давайте рассмотрим, как можно решить задачу поиска выбросов с помощью языка Python и библиотеки PyOD.
Библиотека PyOD включает в себя более 40 алгоритмов обнаружения выбросов, от классических LOF, PCA и kNN до новейших ROD, SUOD и ECOD.
Более подробно ознакомиться со всеми алгоритмами и наборами данных можно по ссылке https://github.com/newtechaudit/pyod.
Давайте сравним скорость и точность нескольких реализованных в этой библиотеке алгоритмов. Возьмём на тестирование 10 алгоритмов из различных категорий.
➡️ Читать дальше
@data_work
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5🔥2
10 октября стартует 4-х недельный курс по Data Science.
Это авторский курс от Владимира, где получаете:
🔸 готовое окружение (устанавливать ничего не нужно)
🔸 100% практику на реальных данных
🔸 обучение под руководством практикующего эксперта
🔸 возможность применять полученные знания в рабочих проектах еще во время обучения
🔸 практические навыки по использованию Python, самых популярных библиотек и алгоритмов
🔸 дополнительную поддержку с пошаговыми видео в каждом уроке
🔸 участие в конкурсе в Kaggle
🔸 возможность создать свое портфолио в GitHub и др.
Важно - в курсе содержится только та практическая информация и инструменты, которые Владимир сам применяет в своей работе!
С 2017 года курс по Data Science прошли 1000+ человек из разных стран мира (работают в Google, IBM, Oracle и т.д.).
Подробная программа и отзывы о курсе 👉 ЗДЕСЬ 👈
Это авторский курс от Владимира, где получаете:
🔸 готовое окружение (устанавливать ничего не нужно)
🔸 100% практику на реальных данных
🔸 обучение под руководством практикующего эксперта
🔸 возможность применять полученные знания в рабочих проектах еще во время обучения
🔸 практические навыки по использованию Python, самых популярных библиотек и алгоритмов
🔸 дополнительную поддержку с пошаговыми видео в каждом уроке
🔸 участие в конкурсе в Kaggle
🔸 возможность создать свое портфолио в GitHub и др.
Важно - в курсе содержится только та практическая информация и инструменты, которые Владимир сам применяет в своей работе!
С 2017 года курс по Data Science прошли 1000+ человек из разных стран мира (работают в Google, IBM, Oracle и т.д.).
Подробная программа и отзывы о курсе 👉 ЗДЕСЬ 👈
❤6👍3
Будете обучаться с нами? ❤️
Anonymous Poll
24%
Да, жду 10 октября
65%
Пока не получается, но хочу
11%
Я уже все знаю :)
👍4
🐼 Топ-10 вопросов о Pandas на StackOverflow
Объем структурированных табличных данных увеличивается с каждым днем. Именно поэтому дата-сайентисту так важно уметь анализировать табличные данные с помощью Pandas. Хотя самообучение — отличный способ повысить квалификацию, иногда может пригодиться и опыт коллег, которые быстрее нашли ответы на актуальные вопросы.
Хотите продвинуться в этом направлении и “прокачать” навыки работы в Pandas? Сделать это вам помогут решения, которые отвечают на десять вопросов из категории Pandas на StackOverflow, собравших наибольшее количество голосов.
@data_work
Объем структурированных табличных данных увеличивается с каждым днем. Именно поэтому дата-сайентисту так важно уметь анализировать табличные данные с помощью Pandas. Хотя самообучение — отличный способ повысить квалификацию, иногда может пригодиться и опыт коллег, которые быстрее нашли ответы на актуальные вопросы.
Хотите продвинуться в этом направлении и “прокачать” навыки работы в Pandas? Сделать это вам помогут решения, которые отвечают на десять вопросов из категории Pandas на StackOverflow, собравших наибольшее количество голосов.
@data_work
👍8🔥4❤2
Сегодня стартовал наш авторский 4-х недельный курс по Data Science - последний шанс присоединиться 😎
dataworkshop.ru
Data Science курс| Machine Learning курс | Аналитик данных | DataWorkshop
Data Science курс поможет получить ключеввые знанания в Data Science и Machine Learning. Много практики. Сосредотачиваемся на решениях. Получи специальность за которую хотят платить!
👍9🔥1
Нашему клубу недавно исполнился 1 год 🥳
И в честь его дня рождения, в эту пятницу, 14 октября в 20:00 по Минску, Киеву, Москве пройдет вебинар.
На вебинаре подведем итоги и расскажем:
- сколько ценностей получают участники клуба уже сейчас.
- как много всего еще будет добавляться в клуб.
Также во время вебинара можно будет:
- задать вопросы Владимиру.
- поучаствовать в голосовании и повлиять на то, что в первую очередь будет добавлено в клуб в ближайшем будущем.
- узнать еще много интересного.
Ссылка на вебинар ЗДЕСЬ.
И в честь его дня рождения, в эту пятницу, 14 октября в 20:00 по Минску, Киеву, Москве пройдет вебинар.
На вебинаре подведем итоги и расскажем:
- сколько ценностей получают участники клуба уже сейчас.
- как много всего еще будет добавляться в клуб.
Также во время вебинара можно будет:
- задать вопросы Владимиру.
- поучаствовать в голосовании и повлиять на то, что в первую очередь будет добавлено в клуб в ближайшем будущем.
- узнать еще много интересного.
Ссылка на вебинар ЗДЕСЬ.
🔥7❤2🤯1
Будешь с нами отмечать день рождения клуба?)
Anonymous Poll
34%
Конечно :)
49%
Буду стараться, чтобы получилось
17%
В следующую годовщину я с вами ;)
This media is not supported in your browser
VIEW IN TELEGRAM
🔥15❤2
Через 30 минут начнется наш вебинар, посвященный дню рождения клуба 🥳
Ссылка на вебинар здесь - https://www.youtube.com/watch?v=q5U9RF9J3jM
С вас хорошее настроение, а с нас подарки 🎁
Ссылка на вебинар здесь - https://www.youtube.com/watch?v=q5U9RF9J3jM
С вас хорошее настроение, а с нас подарки 🎁
YouTube
Вебинар В Честь Дня Рождения DataWorkShop!
Вебинар В Честь Дня Рождения DataWorkShop!
#dataworkshop #datascience #деньрождения #вебинар
Доброго времени суток дорогие друзья! Вы на канале DataWorkShop! Сегодня у нас очень важное событие! Ведь Клубу DataWorkshop уже год (даже немножко больше 🥳).…
#dataworkshop #datascience #деньрождения #вебинар
Доброго времени суток дорогие друзья! Вы на канале DataWorkShop! Сегодня у нас очень важное событие! Ведь Клубу DataWorkshop уже год (даже немножко больше 🥳).…
🔥7🎉1
Почему язык Python называют "unstoppable" ("неудержимый")?
✔ самый популярный
✔ простой
✔ логичный
✔ перспективный
✔ востребованный
✔ широко применимый - продолжать можно долго и это все о Python.
При всех имеющихся преимуществах - ждет ли его светлое будущее?
Подробности здесь 👉 https://dataworkshop.ru/blog/python
@data_work
✔ самый популярный
✔ простой
✔ логичный
✔ перспективный
✔ востребованный
✔ широко применимый - продолжать можно долго и это все о Python.
При всех имеющихся преимуществах - ждет ли его светлое будущее?
Подробности здесь 👉 https://dataworkshop.ru/blog/python
@data_work
❤2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
❤6👍4
💎 Если вы еще не принимали участие в интенсиве "Прогнозирование выживших на Титанике с помощью машинного обучения", то надо это исправлять.
Хотя "Титаник" очень популярный кейс, но для новичков это отличный вариант. В нашем клубе есть такие материалы на реальных данных. Материалы содержат много интересных фактов, а не просто сухой код.
Ознакомиться с материалами первого урока (всего 5) можно по ЭТОЙ ССЫЛКЕ.
@data_work
Хотя "Титаник" очень популярный кейс, но для новичков это отличный вариант. В нашем клубе есть такие материалы на реальных данных. Материалы содержат много интересных фактов, а не просто сухой код.
Ознакомиться с материалами первого урока (всего 5) можно по ЭТОЙ ССЫЛКЕ.
@data_work
👍6🔥1
Добровольцы со всего мира постоянно вкладываются в развитие языка Python.
Сегодня 24.10.2022 выходит новый релиз для Python - версия 3.11 🥳.
Можно по достоинству оценить старания тех, кто вносит свой вклад и трудится над улучшением этого популярного языка.
Краткий обзор самых крутых улучшений в новой версии Python:
🤩Более быстрое выполнение кода благодаря значительным усилиям в проекте Faster CPython. Python 3.11 на 10-60% быстрее, чем Python 3.10 (на стандартном наборе тестов среднее ускорение в 1,25 раза)
🤩Улучшенные сообщения об ошибках, которые помогают быстрее интерпретировать сообщение об ошибке.
🤩Более удобный синтаксис (для поддержки асинхронного программирования).
🤩Новые функции типизации, которые улучшают поддержку статической типизации в Python.
🤩Встроенная поддержка TOML для работы с файлами конфигурации и др.
Более подробно со всеми изменениями предлагаем ознакомиться на с помощью официальной документации для Python.
@data_work
Сегодня 24.10.2022 выходит новый релиз для Python - версия 3.11 🥳.
Можно по достоинству оценить старания тех, кто вносит свой вклад и трудится над улучшением этого популярного языка.
Краткий обзор самых крутых улучшений в новой версии Python:
🤩Более быстрое выполнение кода благодаря значительным усилиям в проекте Faster CPython. Python 3.11 на 10-60% быстрее, чем Python 3.10 (на стандартном наборе тестов среднее ускорение в 1,25 раза)
🤩Улучшенные сообщения об ошибках, которые помогают быстрее интерпретировать сообщение об ошибке.
🤩Более удобный синтаксис (для поддержки асинхронного программирования).
🤩Новые функции типизации, которые улучшают поддержку статической типизации в Python.
🤩Встроенная поддержка TOML для работы с файлами конфигурации и др.
Более подробно со всеми изменениями предлагаем ознакомиться на с помощью официальной документации для Python.
@data_work
❤6🔥1
Будешь тестировать свой код на версии 3.11?
Anonymous Poll
90%
Буду, постепенно :)
10%
Я пока не использую Python
Лучшие нейросети в 2022 году пишут стихи, рисуют картины, ставят диагнозы, помогают находить преступников и делают все больше работы, похожей на человеческую.
Если говорить о нейросетях сетях простым языком, то это область интеллекта, где алгоритмы работают по аналогии с человеческим мозгом (обучаются и исправляют ошибки).
В каких случаях стоит использовать нейронную сеть:
👉Достаточное количество данных для обучения нейронных сетей
👉Имеется необходимая вычислительная мощность.
👉Трудно/невозможно найти четкую взаимосвязь между данными и результирующим значением.
Все топовые компании мира уже используют нейросети. Но нейросети стремительно идут дальше и завоевывают сердца у все большего количества компаний.
По ЭТОЙ ссылке можно ознакомиться с сервисами на основе нейросетей, которые:
🧬 создают лица несуществующих людей
🧬 рисуют картины
🧬 рисует логотипы
🧬 создают из фотографий портреты со стихотворениями
🧬 удаляют фон с изображений за 5 секунд
🧬 раскрашивают черно-белые фото
@data_work
Если говорить о нейросетях сетях простым языком, то это область интеллекта, где алгоритмы работают по аналогии с человеческим мозгом (обучаются и исправляют ошибки).
В каких случаях стоит использовать нейронную сеть:
👉Достаточное количество данных для обучения нейронных сетей
👉Имеется необходимая вычислительная мощность.
👉Трудно/невозможно найти четкую взаимосвязь между данными и результирующим значением.
Все топовые компании мира уже используют нейросети. Но нейросети стремительно идут дальше и завоевывают сердца у все большего количества компаний.
По ЭТОЙ ссылке можно ознакомиться с сервисами на основе нейросетей, которые:
🧬 создают лица несуществующих людей
🧬 рисуют картины
🧬 рисует логотипы
🧬 создают из фотографий портреты со стихотворениями
🧬 удаляют фон с изображений за 5 секунд
🧬 раскрашивают черно-белые фото
@data_work
👍7
Привет, на связи Владимир 🙂
Не все знают, но я уже несколько лет веду подкаст "Бизнес мысли" (пока только на польском языке), где уже более 200 000 прослушиваний.
Во время подкастов я делюсь своими мыслями и опытом из мира машинного обучения.
А еще я часто приглашаю интересных гостей, которые также тесно связаны с миром машинного обучения.
По ЭТОЙ ссылке можно прочитать статью на основании подкаста, который я записывал с Марцином Можейко.
Марцин рассказал о:
☑️ своем опыте работы в китайской компании и рассвете ИИ в Китае
☑️ о возможном сотрудничестве двух миров - академического и мира бизнеса
☑️ лучших практиках в машинном обучении
@data_work
Не все знают, но я уже несколько лет веду подкаст "Бизнес мысли" (пока только на польском языке), где уже более 200 000 прослушиваний.
Во время подкастов я делюсь своими мыслями и опытом из мира машинного обучения.
А еще я часто приглашаю интересных гостей, которые также тесно связаны с миром машинного обучения.
По ЭТОЙ ссылке можно прочитать статью на основании подкаста, который я записывал с Марцином Можейко.
Марцин рассказал о:
☑️ своем опыте работы в китайской компании и рассвете ИИ в Китае
☑️ о возможном сотрудничестве двух миров - академического и мира бизнеса
☑️ лучших практиках в машинном обучении
@data_work
👍3🎉2
Интересно будет читать такие статьи?
Anonymous Poll
79%
Да, ведь там мнения и мысли от практиков
10%
Не люблю читать :)
12%
Буду читать и делиться с друзьями
Завтра в 20:00 по Минску и Москве пройдет live coding вебинар, посвященный конкурсу в Kaggle "Прогнозирование оттока клиентов с помощью машинного обучения".
Конкурс продлится до 6 ноября (включительно).
А чтобы не просто смотреть вебинар, обязательно присоединяйся к конкурсу и делай прогнозы на реальных данных вместе с другими участниками.
Уже более 50 участников из разных стран мира загружают свои решения и прокачивают навыки в Machine Learning.
Материалы для конкурса уже доступны в DWClub. Присоединяйся.
@data_work
Конкурс продлится до 6 ноября (включительно).
А чтобы не просто смотреть вебинар, обязательно присоединяйся к конкурсу и делай прогнозы на реальных данных вместе с другими участниками.
Уже более 50 участников из разных стран мира загружают свои решения и прокачивают навыки в Machine Learning.
Материалы для конкурса уже доступны в DWClub. Присоединяйся.
@data_work
🔥4👌2
Метод Монте Карло (ММК).
ММК используется для поиска решения проблемы, которую слишком сложно решить аналитически.
Например, можно представить, что мы хотим оценить площадь некоторой области с очень неправильными формами - площадь озера. ММК в таком случае даст следующее решение: создайте себе квадрат с известной вам длиной стороны, такой, чтобы все озеро находилось внутри квадрата.
Затем из такого классического равномерного распределения многократно отбираются точки, принадлежащие этому квадрату.
Некоторые из точек будут находиться на поверхности озера, некоторые - нет. Если разделить количество точек, принадлежащих озеру, на количество всех точек, то получится оценка того, какую часть квадрата занимает озеро, а поскольку вы знаете площадь поверхности квадрата, это также дает вам оценку площади поверхности озера.
Как применяли метод Монте Карло в iTaxi, рассказал гость нашего подкаста.
👉 Читать статью
via @data_work
ММК используется для поиска решения проблемы, которую слишком сложно решить аналитически.
Например, можно представить, что мы хотим оценить площадь некоторой области с очень неправильными формами - площадь озера. ММК в таком случае даст следующее решение: создайте себе квадрат с известной вам длиной стороны, такой, чтобы все озеро находилось внутри квадрата.
Затем из такого классического равномерного распределения многократно отбираются точки, принадлежащие этому квадрату.
Некоторые из точек будут находиться на поверхности озера, некоторые - нет. Если разделить количество точек, принадлежащих озеру, на количество всех точек, то получится оценка того, какую часть квадрата занимает озеро, а поскольку вы знаете площадь поверхности квадрата, это также дает вам оценку площади поверхности озера.
Как применяли метод Монте Карло в iTaxi, рассказал гость нашего подкаста.
👉 Читать статью
via @data_work
❤7👍1