Big Data Science – Telegram
Big Data Science
3.74K subscribers
65 photos
9 videos
12 files
637 links
Big Data Science channel gathers together all interesting facts about Data Science.
For cooperation: a.chernobrovov@gmail.com
💼https://news.1rj.ru/str/bds_job — channel about Data Science jobs and career
💻https://news.1rj.ru/str/bdscience_ru — Big Data Science [RU]
Download Telegram
❗️до 30 августа❗️

Если кто-то давно искал возможность участия в классном мероприятии, то вот она!
До 30 августа можно подать заявку в Russian Hack Team (на базе МФТИ). Отличный шанс классно развиваться, участвовать в топовых международных хакатонах, путешествовать по миру. Поэтому очень советую поучаствовать и пройти отбор!

Для кого: студенты/выпускники технических специальностей, IT-специалистов с опытом работы в компании или фрилансеров, основателей и сотрудников IT-стартапов.

Зарегистрироваться можно по ссылке 👇🏽❗️
http://russianhackteam.com/
Хочу быть Data Scientist или прокачаться в этой сфере, что делать

Сегодня Data Science - очень трендовая тема, ведь любая компания собирает данные, поэтому за последнее время к этой сфере особенно возрос интерес. Однако, чтобы стать Data Scientist нужны так или иначе знания в этой области.
Какие есть варианты?

🏛ВУЗЫ
⁃ Факультет компьютерных наук в Высшей Школе Экономики
⁃ Факультет инноваций и высоких технологий в МФТИ
⁃ Магистерская программа «Большие Данные» на факультете ВМиК МГУ
⁃ Магистерская программа по большим данным в СПБГУ

Однако вузы занимают достаточно продолжительное время обучения, что и является в данном случае минусом, и не всегда ясно, насколько это обучение может быть полезно.

💡НЕКОММЕРЧЕСКИЕ КУРСЫ ДОПОЛНИТЕЛЬНОГО ОБРАЗОВАНИЯ
Это специальные учебные центры, которые создаются компаниями специально для увеличения кадров на рынке. Однако, чтобы поступить на эти курсы, необходимо сдать определенные экзамены.
Самые известные:
⁃ Школа Анализа Данных «Яндекса» (Срок обучения - 2 года)
⁃ Техносфера Mail.RU и факультета ВМиК МГУ (Срок обучения - 2 года)
⁃ Технопарк Mail.Ru и МГТУ им. Баумана (Срок обучения - 2 года)
⁃ Центр компьютерных наук или Computer Science Center (Срок обучения - 2 года)

⚙️КОММЕРЧЕСКИЕ КУРСЫ
Здесь уже значительно более короткие сроки обучения.
⁃ Курс «Специалист по большим данным» от «Лаборатории Новых Профессий»
⁃ «Школа данных Билайна»
⁃ Изучение профессии Data Scientist при Нетологии (формат онлайн-вебинаров
и очных лекций)

🖥ОНЛАЙН-ОБРАЗОВАНИЕ
Большинство онлайн-курсов англоязычные, однако за последнее время число русскоязычных значительно увеличилось.
Можно выделить:
⁃ Специализация «Машинное обучение и анализ данных» на Coursera
⁃ «Введение в машинное обучение на Coursera»
⁃ «Анализ данных в R» на Stepic
⁃ Курс Эндрю Ына

Помимо курсов есть также митапы, Data Science - тусовки, например, DS-завтраки, конференции и различные интересные лекции и вебинары. Этих мероприятий бесплатные и на них может прийти любой желающий.

Конечно же выбирать вам, что лучше лично для вас, в том числе учитывая все финансовые и временные моменты.

Очень важно отметить, что сегодня сфера аналитики и больших данных не стоит на месте, поэтому постоянно открываются новые возможности, появляются новые курсы и также компании вводят новые должности, которых до этого не было. Так что необходимо всегда обновлять свои знания в данной сфере.

Удачи 💫
IMG_2935.JPG
1.5 MB
Modern Data Scientist? Who is it?
Forwarded from ODS Events
Видео докладов секции ML economics:

🔸Алексей Чернобровов – Как подготовить бизнес для Data Science
🔸Павел Мягких – Анализ бизнес-процессов для внедрения ML
🔸Федор Лавреньтев – Как не обанкротиться на машинном обучении
🔸Евгений Лимаренко – Ожидание бизнеса от DS стартапа (в бабках)

https://www.youtube.com/playlist?list=PLXggmPzAxFwp2BmXUpNvekhgITA82f2k3
This media is not supported in your browser
VIEW IN TELEGRAM
Полезные библиотеки для Data Scientist на 5 разных языках (это не R и не Python):

1️⃣SCALA:
Scala - это современный мультипарадигмальный язык программирования с открытым исходным кодом, созданный Мартином Одерским в 2003 году. Scala означает «Масштабируемый язык». Он разработан, чтобы выразить общие стандарты программирования в краткой, элегантной и безопасной для типов форме.
Top Scala Libraries for Data Science:
⁃ Breeze - https://github.com/scalanlp/breeze
⁃ Vegas - https://github.com/vegas-viz/Vegas
⁃ Smile - https://github.com/haifengl/smile
⁃ DeepLearning.scala - https://github.com/ThoughtWorksInc/DeepLearning.scala

2️⃣JULIA:
Julia – это высокоуровневый высокопроизводительный свободный язык программирования с динамической типизацией, созданный для математических вычислений.
Top Julia Libraries for Data Science:
⁃ DataFrames.jl - https://github.com/JuliaData/DataFrames.jl
⁃ Plots.jl - https://github.com/JuliaPlots/Plots.jl
⁃ ScikitLearn.jl - https://github.com/cstjean/ScikitLearn.jl
3️⃣JAVASCRIPT:
JavaScript – это мультипарадигменный язык программирования. Поддерживает объектно-ориентированный, императивный и функциональный стили. 
Top JavaScript Libraries for Data Science:
⁃ Math.js - https://github.com/josdejong/mathjs
⁃ D3.js - https://github.com/d3/d3
⁃ Tensorflow.js - https://github.com/tensorflow/tfjs

4️⃣SWIFT:
Swift - это открытый мультипарадигмальный компилируемый язык программирования общего назначения. Создан компанией Apple в первую очередь для разработчиков iOS и macOS. 
Top Swift Libraries for Data Science:
⁃ Nifty (Demo) - https://github.com/nifty-swift/Nifty-demo
⁃ Swiftplot - https://github.com/KarthikRIyer/swiftplot
⁃ Swift for TensorFlow - https://github.com/tensorflow/swift
⁃ Swift AI - https://github.com/Swift-AI/Swift-AI


5️⃣SPARK:
Spark -  фреймворк с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop. 
Top Spark Libraries for Data Science:
⁃ Spark SQL - https://github.com/apache/spark/tree/master/sql
⁃ GraphX - https://github.com/apache/spark/tree/master/graphx
⁃ MLib - https://github.com/apache/spark/tree/master/mllib
⁃ Spark NLP - https://github.com/JohnSnowLabs/spark-nlp
анонс_конференций_сентябрь.docx
17.3 KB
💥Теперь в начале каждого месяца мы будем рассказывать о конференциях, митапах, мастер-классах и прочих ивентах по Big Data, Data Science и Machine Learning.
На многие из этих конференций в качестве слушателя можно попасть бесплатно по предварительной регистрации.
В сентябре нас ждут множество событий в Москве, Санкт-Петербурге, Нижнем Новгороде, Екатеринбурге и Франкфурте-на-Майне. Всю информацию вы сможете найти в прикрепленной таблице.

Участвуйте, делитесь опытом и и повышайте свой профессиональный уровень в Big Data Science!
Forwarded from Kantor.AI (Victor Kantor)
Запуск Академии больших данных MADE

В сообществе уже известно, что с июля я работаю в Mail.ru Group. Настало время рассказать, что это значит.

К моим образовательным проектам добавился новый, очень важный для меня проект — Академия больших данных MADE.

Что такое MADE?
Mail.ru Group запускает образовательные программы для специалистов с опытом. Уже запустилась Академия продукт менеджеров.
Последние два месяца большую часть времени я искал преподавателей и уточнял программу для аналогичного (только более продолжительного) проекта для Data scientist’ов, ML и Data инженеров — Академии больших данных.

Длительность программы - 3 семестра (1,5 года), начиная с этого октября, обучение бесплатное.

Что будет в первом семестре?

Первый семестр — «выравнивающий». Он помогает всем подтянуть машинное обучение, алгоритмы и структуры данных и что-то по выбору: либо продвинутые курсы С++/Java/Python от опытных в продакшн-разработке преподавателей, либо прикладную статистику на курсе «Статистические методы анализа данных» Михаила Борисовича Лагутина (автора той самой «Наглядной матстатистики» — она же «книжка с коровой» 🙂

В случае курсов по программированию ожидается, что вы выбираете тот язык, на котором уже умеете писать код, но хотите делать это чуть увереннее и меньше бояться продакшена. Если же вы хотите быть тем аналитиком данных, который не пишет в продакшн… нет, никто не погонит вас вон из профессии, можете просто смело выбирать статистику и прокачиваться в теории 🙂 То же самое вы можете сделать, если в программировании вы уже сами можете учить кого угодно и чему угодно.

В этом одна из важный особенностей Академии больших данных — мы постарались учесть, что у компаний есть потребности в различных специалистах, а у людей бывают разные таланты, и построить процесс так, чтобы дать как можно большему числу людей возможность прокачаться. Кстати, заочное обучение тоже сразу будет. И это я пока рассказал только про первый семестр, а самое интересное будет во втором и третьем: очень много практики, интересные проекты, курсы про то, как делать ML в большой IT компании для сервисов с миллионами пользователей, ну и конечно — бесподобные преподаватели.

Когда живешь каким-то проектом, можешь говорить о нем очень много, но пожалуй не буду стараться запихнуть все мысли в один пост. Просто заходите на data.mail.ru и посмотрите, а чуть позже я еще напишу про отбор в академию, преподавателей, 2-3 семестр, почему Академия больших данных — это очень важный проект для Data Science сообщества и другие интересные вещи.
Поиск по датасэтам от Google. Пока в бета-версии.

https://toolbox.google.com/datasetsearch
📚Учебный год только начался, но для тех, кто хотел бы обучаться в университетах за границей по профилям Data Science, самое время задуматься о том, в какой вуз вы хотели бы пойти, узнать сроки подачи заявлений и начать собирать необходимые документы.
Есть варианты в Германии, Испании, Франции, Бельгии, Италии и даже Финляндии:
https://www.analyticsindiamag.com/data-science-in-europe-10-masters-programmes-you-can-apply-for/
💥Чемпионат по программированию от Яндекс💥

Компания «Яндекс» объявила о старте регистрации участников нового чемпионата по программированию: победителей мероприятия ждут крупные денежные призы.
Чемпионат предусматривает проведение двух раундов. Первый — квалификационный — будет идти с 14 по 20 октября. Второй, финальный, раунд назначен на 26 октября.

Регистрируемся по ссылке и пытаем удачу🌟:
https://yandex.ru/championship/
7 фактов о Big Data 🤩
В дополнение к этой статье советуем посмотреть интересное видео, как с помощью генетического алгоритма и глубокого обучения разработчик научил ИИ играть в «змейку». Обратите внимание, уже на 25-ой попытке змейка показывает впечатляющие результаты.
🐍Ссылка: https://www.youtube.com/watch?v=3bhP7zulFfY
💸Как не разориться на Data Science💸

Почему 85% Big Data проектов обречены на неудачу и как запустить успешный проект по аналитике данных с привлечением внештатного консультанта – практические рекомендации бизнесу.

Подробнее читайте в статье:
https://chernobrovov.ru/articles/kak-ne-razoritsya-na-data-science.html
Machine Learning - эффективный метод не только для предиктивной аналитики и распознавания картинок, но и отличный инструмент для cybersecurity-систем. Статья о том, как искусственный интеллект работает в антивирусных системах, аналогично "настоящему" иммунитету живых организмов:

https://m.habr.com/ru/company/otus/blog/463891/
Друзья, уже в эту субботу, 28 сентября 2019 года, в столице Сибири – городе Новосибирске, состоится главное Data Science событие года – открытый фестиваль DataFest Siberia. Как обычно, помимо новейших научных исследований и практических кейсов, нас ждет дружеская обстановка, море позитива, неформальное общение с энергичной молодежью и опытными профессионалами в области анализа данных и машинного обучения.
Целый день, с 9 утра до позднего вечера в самом модном месте Новосибирска, лектории-баре «Поток», мы будем делиться друг с другом прикладными знаниями по Data Science, Machine Learning и другим методам Artificial Intelligence. Я расскажу о применении искусственного интеллекта в ритейле и последних ML-инструментах, которые недавно обсуждались на международном саммите в Лондоне. Топовые спикеры, менеджеры, исследователи, аналитики, администраторы, программисты из крупных ИТ-компаний и перспективных стартапов покажут, как используются современные ML-алгоритмы в бизнесе, кибербезопасности, медицинской диагностике, разработке программного обеспечения и инженерии данных. Также состоится практический семинар, где будут разбираться интересные задачи от всем известной соревновательной площадки Kaggle.com.
Кроме познавательных лекций, дискуссий и мастер-классов, участников ожидает дружеская атмосфера и неформальный нетворкинг в сообществе специалистов по DS, AI и ML. А после основной программы мы продолжим общение на развлекательной afterparty. И, что весьма важно, вход на все это крутое мероприятие свободный по предварительной регистрации. С нетерпением жду предстоящей субботы и приглашаю вас на этот замечательный DS-интенсив. До скорой встречи!

https://datafest.ru/siberia/
🔎Аналитика данных и Data Science: сходства и различия

Почему Data Science – это больше, чем просто анализ информации, чем Data Scientist отличается от Data Analyst’а, в каких случаях и для чего бизнесу необходимы оба этих профессионала.

https://chernobrovov.ru/articles/analitika-dannyh-i-data-science-shodstva-i-razlichiya.html