DataWorkshop - AI & ML – Telegram
DataWorkshop - AI & ML
1.91K subscribers
204 photos
22 videos
13 files
150 links
Онлайн-обучение от европейской компании DataWorkshop.

Курсы по: Статистике, SQL, Python, Data Science, Нейронным сетям, Time Series, NLP.

Корпоративное обучение.

Помогаем внедрять машинное обучение в бизнес.

Сайт:
https://dataworkshop.ru
Download Telegram
🔟Ошибки не должны замалчиваться.
1️⃣1️⃣Если не замалчиваются явно.
1️⃣2️⃣Встретив двусмысленность, отбрось искушение угадать.
1️⃣3️⃣Должен существовать один - и, желательно, только один – очевидный способ сделать что-то.
1️⃣4️⃣Хотя этот способ поначалу может быть и не очевиден, если вы не голландец.
1️⃣5️⃣Сейчас лучше, чем никогда.
1️⃣6️⃣Хотя никогда часто лучше, чем *прямо* сейчас.
1️⃣7️⃣Если реализацию сложно объяснить – идея точно плоха.
1️⃣8️⃣Если реализацию легко объяснить – возможно, идея хороша.
1️⃣9️⃣Пространства имен – отличная штука! Будем использовать их чаще!
Мир меняется быстрее, чем Ты думаешь 🚀
Записал сегодня видео и хочу поделиться тем, какие изменения могут коснуться программистов уже в ближайшем будущем.

Спойлер: ты пишешь на простом языке, что хочешь сделать, а искусственный интеллект самостоятельно генерирует код 🤖

При этом хочу отметить, что
навыки машинного обучения будут все более востребованными 💪🦾

Ссылка на видео: https://bit.ly/3fTRj8f

Ссылка на полную версию видео от Open AI: https://bit.ly/2VL4h1g
Как Ты думаешь - сильно ли изменится мир программирования в ближайшем будущем 🙂?
Anonymous Poll
43%
Несомненно
45%
Все идет к этому
11%
Не думаю об этом
А вы знали, что роботы уже научились шутить над людьми? 😀

Технологии с каждым новым днем все более совершенствуются и то, что вчера казалось невозможным - сегодня уже становится реальностью.

Уже в наши дни можно общаться по телефону и не понимать, что на Твои вопросы отвечает робот, а не человек 🤖

Считается, что обработка текста и звучащей речи (NLP, Speech Analytics) – один из главных трендов 2021 года в сфере развития искусственного интеллекта.

NLP - это обработка естественного языка.
К этому направлению относится всё, что касается речевой аналитики, обработки и синтеза речи.

Простыми словами — это то, что позволяет людям и машинам общаться и взаимодействовать без посредников.

А для чего все это придумали? NLP — базовая технология, на основе которой можно создавать цифровые продукты. Благодаря NLP-технологиям сделаны такие разработки:
«Умные» предметы обихода, которыми можно управлять с помощью голоса
Чат-боты
Siri, «Алиса»
“Умный” спам-фильтр
Классификатор сообщений
Оценка пользовательских отзывов и запросов и др.

Всё это приводит к росту инвестиций, увеличению числа компаний и команд, и появлению большего числа Open Source-моделей.

А на онлайн-курсах DataWorkshop можно получить практические навыки и знания в работе с NLP.

Пока думаем над датой выпуска именно этого курса - он есть только на польском языке, но планируем сделать еще более улучшенную его версию и тогда уже перевести и на русский язык.
🌏В последнее время (особенно после пандемии) все чаще можно услышать, что весь мир уходит в онлайн.

Что это значит? Перед людьми открываются невероятные возможности! По удаленке можно работать во многих компаниях мира.

А специалисты с навыками Machine Learning в западных странах мира пользуются просто огромной популярностью и востребованностью.

Работая по удаленке на компании “с Запада” и не только, как правило, нужен еще и английский язык. И мы решили пойти еще дальше.

🤖Поскольку наша компания фокусируется только на проектах по машинному обучению, мы решили найти такого же крутого партнера, но уже по обучению английскому.

🇺🇸Основное преимущество партнера - у них уже большой опыт преподавания английского для работников в сфере IT. Но вскоре расскажем более подробно обо всем.

🤝А пока просим пройти опрос, который поможет нашему партнеру лучше изучить ваши потребности в изучении английского языка.

Ссылка на опросник - https://bit.ly/3y3NbbS
Периодически нам приходят от вас вопросы - что почитать, особенно перед стартом курсов.

Хотим порекомендовать вот эти 2 книги, которые написал Жерон Орельен (их можно читать всем желающим, кто хочет начать изучать машинное обучение):

Прикладное машинное обучение с помощью Scikit-Learn, Keras TensorFlow.

Из этой книги узнаете основы машинного обучения на сквозном проекте с применением Scikit-Learn и Pandas, построите и обучите нейронные сети и др.

В каждой главе есть упражнения, которые помогут закрепить на практике полученные знания, причем весь код из книги доступен на GitHub.


Python Data Science Handbook
В этой книге можно поближе познакомиться с библиотеками Pandas, NumPy, Matplotlib, а также в ней есть отдельный блок, посвященный машинному обучению.

Эта книга бесплатная, вот ссылка - http://bit.ly/2UNA92t

Ребята - кто идет на наши курсы, предупреждаем - на курсах будет интенсивно и будет много дополнительной бесплатной информации - эти книги во время курсов некогда будет читать 🤗
Рекомендовать в будущем литературу для чтения? 🤓
Anonymous Poll
97%
Да - интересно
1%
Я и так все знаю ;)
2%
Не люблю читать
Python впервые за всю историю скоро может стать самым популярным языком программирования во всем мире. Ведь он уже почти догнал такие языки , как С и Java. 🦾

Согласно веб-сайту Stack Overflow, вопросы с тегом Python имеют максимальное количество просмотров в 2018 году в странах с высоким уровнем дохода. На первом фото виден огромный рост популярности языка Python за последние 5 лет.

Stack Overflow показывает, что с января 2016 года по август 2017 года темпы роста трафика Python увеличились на 27%. В то время как для JavaScript, C ++, Ruby, iOS и т. д. темпы роста снизились по сравнению с прошлыми несколькими годами.

TIOBE составляет рейтинг популярности языков программирования методом подсчета результатов поисковых запросов, связанных с программированием (результат на 2 фото).

У Python, похоже, есть все шансы стать номером один благодаря своему лидерству на рынке в быстро развивающейся области интеллектуального анализа данных и искусственного интеллекта», – сказал Янсен, ген. директор TIOBE.
Напоминаю, что уже 6 сентября мы впервые запускаем курс "Практическое введение в Python для Data Science" - на русском языке.
Это необычный курс по Python.

Это мини-курс, который позволит в сжатые сроки получить навыки в Python для дальнейшего его применения в Machine Learning и Data Science.

Это мой авторский курc, в который я собрал только те материалы, которые действительно, используют в рабочих проектах.

Я придерживаюсь правила 20/80 (чтобы 20% усилий приносили 80% результата) и давать те навыки и знания, которые сразу можно применять на практике - в своей работе.

Ведь "засорить мозг ненужным" никогда не было проблемой - особенно сейчас - в век "информационного ожирения".

Я же учу тому, что действительно работает на практике и делюсь лучшими техниками, которые сам применяю в работе. А поделиться мне есть чем - свой многолетний опыт я получал в европейских и американских компаниях разного масштаба 😉.

С завтрашнего дня цена на курс повышается - успей его приобрести по старой цене.

Успей купить курс по старой цене:

>>> https://bit.ly/3BGUkky <<<
DATAWORKSHOP-INSTAGRAM (3).png
56.3 KB
Владимир недавно записал подкаст со студентом со своего самого первого курса "Практическое машинное обучение с нуля" на тему: "Машинное обучение и кибербезопасность".

Сейчас Мирослав (наш студент) работает в "Santander Bank Polska" и использует искусственный интеллект для борьбы с киберпреступниками 😎.

Мирослав рассказал, как они построили модель машинного обучения (на основании 20000 транзакций, которые проходят за 1 банковский день), чтобы выловить из них мошеннические транзакции 🦸‍♂️

Что интересно - модели удается вылавливать 90% мошеннических транзакций. По рассказам Мирослава - бизнес ежедневно отсекает подозрительных 20-30 транзакций.

Дополнительная проверка таких транзакций показывает, что, действительно, ⅔ из них являются попыткой вымогательства 😮


Причем, используется довольно простая модель машинного обучения, но результаты впечатляют - не правда ли 😉

Подкаст записан на польском языке, но по ссылке можно почитать перевод на русском языке

https://bit.ly/3BRn4XU
Стоит ли Владимиру начать записывать подкасты уже и на русском языке?
Anonymous Poll
63%
Да, давно пора)
31%
Было бы здорово
5%
Буду учить польский, на русском не надо ))
Scikit-learn, бесплатная библиотека машинного обучения для языка программирования Python, анонсировала release candidate Scikit-learn 1.0 с основными обновлениями и исправлениями:

https://scikit-learn.org/dev/whats_new/v1.0.html

Scikit-Learn-одна из популярных программных библиотек машинного обучения. Библиотека использует NumPy, SciPy и Matplotlib и поддерживает обучение с учителем и без.

Она также предоставляет различные инструменты для подгонки модели, предварительной обработки данных, выбора и оценки модели.

Честно говоря, Владимир считает, что Scikit-learn является лучшей библиотекой в ML 😍 с точки зрения того, как мы думаем об API и простоте. Она меняет правила игры. И это (следующий 🤔 ) отличный пример, показывающий силу open source.

Scikit-learn - это своего рода стандарт, который изменил (упростил) жизнь в ML (причем не только в Python). Создатели 14 лет трудились, чтобы дойти до стабильной нумерации версии Scikit-learn.

Scikit-learn - это эталон простоты и мощной работы.
Кстати, если вы хотите начать использовать ML (в том числе узнать и о Scikit-learn), присоединяйтесь к курсу по ссылке: 😉
>>>> https://bit.ly/3jX02sH <<<<
15 основных функций библиотеки Pandas (часть 1)

Рассказываем о лучших функциях библиотеки Pandas. Эти функции стоит знать, чтобы по максимуму использовать библиотеку Pandas.


1️⃣Обработка данных
Библиотека Pandas предоставляет действительно быстрый и эффективный способ для работы с данными.

Pandas предоставляет нам Series и DataFrames, которые помогают не только эффективно представлять данные, но и манипулировать ими различными способами. Именно эти особенности Pandas делают ее такой привлекательной библиотекой для Data Scientist-ов.

2️⃣ Очистка данных
Работа с грязными данными неизбежна.Очистка данных - это часть процесса при работе с данными.
Чем чище данные, тем лучше результат.
Чрезвычайно важно очищать наши данные и с помощью Pandas это легко реализовать.

3️⃣ Маркировка данных
Данные бесполезны, если вы не знаете, где они находятся и о чем они нам говорят. Поэтому маркировка данных имеет первостепенное значение.

4️⃣ Обработка недостающих данных
Одна из многих проблем, связанных с данными, - это отсутствие данных или значений. Поэтому важно правильно обработать недостающие значения, чтобы они не искажали результаты нашего исследования.

5️⃣ Инструменты ввода и вывода
Pandas предоставляет широкий спектр встроенных инструментов для чтения и записи данных. Во время анализа вам, очевидно, потребуется читать и записывать данные в структуры данных, базы данных и т. д.

Это можно сделать чрезвычайно просто с помощью встроенных инструментов Pandas.

В следующих постах продолжим рассматривать функции в Pandas
6️⃣ Поддержка нескольких форматов файлов
Pandas поддерживает огромное количество разных форматов файлов (hdf5, csv, json, Excel и т. д.).

7️⃣ Объединение наборов данных
Pandas может помочь объединить различные наборы данных с максимальной эффективностью, что помогает получить оочный результат (без искажения).😱

8️⃣Оптимизированная производительность
Pandas высокоуровневая библиотека для анализа данных - построена поверх более низкоуровневой библиотеки NumPy (написана на Си), что является большим плюсом в производительности.

9️⃣ Поддержка Python
Python стал одним из самых востребованных языков программирования при анализе данных, т.к. имеет в своем распоряжении огромное количество библиотек. Pandas является частью Python и позволяет получать доступ к другим библиотекам (NumPy и MatPlotLib).

🔟 Большое количество временных рядов
Эти функции Pandas не будут иметь смысла для новичков сразу, но они будут очень полезны в будущем. Эти функции включают в себя статистику движущихся окон и преобразование частоты.
У нас для вас отличная новость 🥳

Многие из вас уже участвовали в нашем онлайн-интенсиве DWthon, где мы применяли ML при работе с данными магазина из Великобритании.

В предстоящие выходные (25 и 26 сентября) мы запускаем новый интенсив - Dwthon 2.0.
Будем прогнозировать цены на автомобили с помощью ML 🦾

Что вас ждет на 2-дневном интенсиве:
готовое окружение (Jupyter), в котором будем работать - устанавливать ничего не нужно
реальные данные
для начинающих дополнительная поддержка
создаете и тренируете свои модели машинного обучения
участвуете в конкурс в Kaggle и др.

Для первых 1000 записавшихся, участие абсолютно бесплатное, поспешите 😉

> https://bit.ly/3EFTy9O <
Наш интенсив "Прогнозирование цен на автомобили с помощью Machine Learning" стартовал 🚀.

На email отправлены данные для авторизации на сервере.
В Slack вся подробная информация с планом проведения интенсива.

Если вы еще не там - присоединяйтесь 🙂
Мы начинаем 🦾💪