Big Data Science – Telegram
Big Data Science
3.74K subscribers
65 photos
9 videos
12 files
637 links
Big Data Science channel gathers together all interesting facts about Data Science.
For cooperation: a.chernobrovov@gmail.com
💼https://news.1rj.ru/str/bds_job — channel about Data Science jobs and career
💻https://news.1rj.ru/str/bdscience_ru — Big Data Science [RU]
Download Telegram
Forwarded from ODS Events
Видео докладов секции ML economics:

🔸Алексей Чернобровов – Как подготовить бизнес для Data Science
🔸Павел Мягких – Анализ бизнес-процессов для внедрения ML
🔸Федор Лавреньтев – Как не обанкротиться на машинном обучении
🔸Евгений Лимаренко – Ожидание бизнеса от DS стартапа (в бабках)

https://www.youtube.com/playlist?list=PLXggmPzAxFwp2BmXUpNvekhgITA82f2k3
This media is not supported in your browser
VIEW IN TELEGRAM
Полезные библиотеки для Data Scientist на 5 разных языках (это не R и не Python):

1️⃣SCALA:
Scala - это современный мультипарадигмальный язык программирования с открытым исходным кодом, созданный Мартином Одерским в 2003 году. Scala означает «Масштабируемый язык». Он разработан, чтобы выразить общие стандарты программирования в краткой, элегантной и безопасной для типов форме.
Top Scala Libraries for Data Science:
⁃ Breeze - https://github.com/scalanlp/breeze
⁃ Vegas - https://github.com/vegas-viz/Vegas
⁃ Smile - https://github.com/haifengl/smile
⁃ DeepLearning.scala - https://github.com/ThoughtWorksInc/DeepLearning.scala

2️⃣JULIA:
Julia – это высокоуровневый высокопроизводительный свободный язык программирования с динамической типизацией, созданный для математических вычислений.
Top Julia Libraries for Data Science:
⁃ DataFrames.jl - https://github.com/JuliaData/DataFrames.jl
⁃ Plots.jl - https://github.com/JuliaPlots/Plots.jl
⁃ ScikitLearn.jl - https://github.com/cstjean/ScikitLearn.jl
3️⃣JAVASCRIPT:
JavaScript – это мультипарадигменный язык программирования. Поддерживает объектно-ориентированный, императивный и функциональный стили. 
Top JavaScript Libraries for Data Science:
⁃ Math.js - https://github.com/josdejong/mathjs
⁃ D3.js - https://github.com/d3/d3
⁃ Tensorflow.js - https://github.com/tensorflow/tfjs

4️⃣SWIFT:
Swift - это открытый мультипарадигмальный компилируемый язык программирования общего назначения. Создан компанией Apple в первую очередь для разработчиков iOS и macOS. 
Top Swift Libraries for Data Science:
⁃ Nifty (Demo) - https://github.com/nifty-swift/Nifty-demo
⁃ Swiftplot - https://github.com/KarthikRIyer/swiftplot
⁃ Swift for TensorFlow - https://github.com/tensorflow/swift
⁃ Swift AI - https://github.com/Swift-AI/Swift-AI


5️⃣SPARK:
Spark -  фреймворк с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop. 
Top Spark Libraries for Data Science:
⁃ Spark SQL - https://github.com/apache/spark/tree/master/sql
⁃ GraphX - https://github.com/apache/spark/tree/master/graphx
⁃ MLib - https://github.com/apache/spark/tree/master/mllib
⁃ Spark NLP - https://github.com/JohnSnowLabs/spark-nlp
анонс_конференций_сентябрь.docx
17.3 KB
💥Теперь в начале каждого месяца мы будем рассказывать о конференциях, митапах, мастер-классах и прочих ивентах по Big Data, Data Science и Machine Learning.
На многие из этих конференций в качестве слушателя можно попасть бесплатно по предварительной регистрации.
В сентябре нас ждут множество событий в Москве, Санкт-Петербурге, Нижнем Новгороде, Екатеринбурге и Франкфурте-на-Майне. Всю информацию вы сможете найти в прикрепленной таблице.

Участвуйте, делитесь опытом и и повышайте свой профессиональный уровень в Big Data Science!
Forwarded from Kantor.AI (Victor Kantor)
Запуск Академии больших данных MADE

В сообществе уже известно, что с июля я работаю в Mail.ru Group. Настало время рассказать, что это значит.

К моим образовательным проектам добавился новый, очень важный для меня проект — Академия больших данных MADE.

Что такое MADE?
Mail.ru Group запускает образовательные программы для специалистов с опытом. Уже запустилась Академия продукт менеджеров.
Последние два месяца большую часть времени я искал преподавателей и уточнял программу для аналогичного (только более продолжительного) проекта для Data scientist’ов, ML и Data инженеров — Академии больших данных.

Длительность программы - 3 семестра (1,5 года), начиная с этого октября, обучение бесплатное.

Что будет в первом семестре?

Первый семестр — «выравнивающий». Он помогает всем подтянуть машинное обучение, алгоритмы и структуры данных и что-то по выбору: либо продвинутые курсы С++/Java/Python от опытных в продакшн-разработке преподавателей, либо прикладную статистику на курсе «Статистические методы анализа данных» Михаила Борисовича Лагутина (автора той самой «Наглядной матстатистики» — она же «книжка с коровой» 🙂

В случае курсов по программированию ожидается, что вы выбираете тот язык, на котором уже умеете писать код, но хотите делать это чуть увереннее и меньше бояться продакшена. Если же вы хотите быть тем аналитиком данных, который не пишет в продакшн… нет, никто не погонит вас вон из профессии, можете просто смело выбирать статистику и прокачиваться в теории 🙂 То же самое вы можете сделать, если в программировании вы уже сами можете учить кого угодно и чему угодно.

В этом одна из важный особенностей Академии больших данных — мы постарались учесть, что у компаний есть потребности в различных специалистах, а у людей бывают разные таланты, и построить процесс так, чтобы дать как можно большему числу людей возможность прокачаться. Кстати, заочное обучение тоже сразу будет. И это я пока рассказал только про первый семестр, а самое интересное будет во втором и третьем: очень много практики, интересные проекты, курсы про то, как делать ML в большой IT компании для сервисов с миллионами пользователей, ну и конечно — бесподобные преподаватели.

Когда живешь каким-то проектом, можешь говорить о нем очень много, но пожалуй не буду стараться запихнуть все мысли в один пост. Просто заходите на data.mail.ru и посмотрите, а чуть позже я еще напишу про отбор в академию, преподавателей, 2-3 семестр, почему Академия больших данных — это очень важный проект для Data Science сообщества и другие интересные вещи.
Поиск по датасэтам от Google. Пока в бета-версии.

https://toolbox.google.com/datasetsearch
📚Учебный год только начался, но для тех, кто хотел бы обучаться в университетах за границей по профилям Data Science, самое время задуматься о том, в какой вуз вы хотели бы пойти, узнать сроки подачи заявлений и начать собирать необходимые документы.
Есть варианты в Германии, Испании, Франции, Бельгии, Италии и даже Финляндии:
https://www.analyticsindiamag.com/data-science-in-europe-10-masters-programmes-you-can-apply-for/
💥Чемпионат по программированию от Яндекс💥

Компания «Яндекс» объявила о старте регистрации участников нового чемпионата по программированию: победителей мероприятия ждут крупные денежные призы.
Чемпионат предусматривает проведение двух раундов. Первый — квалификационный — будет идти с 14 по 20 октября. Второй, финальный, раунд назначен на 26 октября.

Регистрируемся по ссылке и пытаем удачу🌟:
https://yandex.ru/championship/
7 фактов о Big Data 🤩
В дополнение к этой статье советуем посмотреть интересное видео, как с помощью генетического алгоритма и глубокого обучения разработчик научил ИИ играть в «змейку». Обратите внимание, уже на 25-ой попытке змейка показывает впечатляющие результаты.
🐍Ссылка: https://www.youtube.com/watch?v=3bhP7zulFfY
💸Как не разориться на Data Science💸

Почему 85% Big Data проектов обречены на неудачу и как запустить успешный проект по аналитике данных с привлечением внештатного консультанта – практические рекомендации бизнесу.

Подробнее читайте в статье:
https://chernobrovov.ru/articles/kak-ne-razoritsya-na-data-science.html
Machine Learning - эффективный метод не только для предиктивной аналитики и распознавания картинок, но и отличный инструмент для cybersecurity-систем. Статья о том, как искусственный интеллект работает в антивирусных системах, аналогично "настоящему" иммунитету живых организмов:

https://m.habr.com/ru/company/otus/blog/463891/
Друзья, уже в эту субботу, 28 сентября 2019 года, в столице Сибири – городе Новосибирске, состоится главное Data Science событие года – открытый фестиваль DataFest Siberia. Как обычно, помимо новейших научных исследований и практических кейсов, нас ждет дружеская обстановка, море позитива, неформальное общение с энергичной молодежью и опытными профессионалами в области анализа данных и машинного обучения.
Целый день, с 9 утра до позднего вечера в самом модном месте Новосибирска, лектории-баре «Поток», мы будем делиться друг с другом прикладными знаниями по Data Science, Machine Learning и другим методам Artificial Intelligence. Я расскажу о применении искусственного интеллекта в ритейле и последних ML-инструментах, которые недавно обсуждались на международном саммите в Лондоне. Топовые спикеры, менеджеры, исследователи, аналитики, администраторы, программисты из крупных ИТ-компаний и перспективных стартапов покажут, как используются современные ML-алгоритмы в бизнесе, кибербезопасности, медицинской диагностике, разработке программного обеспечения и инженерии данных. Также состоится практический семинар, где будут разбираться интересные задачи от всем известной соревновательной площадки Kaggle.com.
Кроме познавательных лекций, дискуссий и мастер-классов, участников ожидает дружеская атмосфера и неформальный нетворкинг в сообществе специалистов по DS, AI и ML. А после основной программы мы продолжим общение на развлекательной afterparty. И, что весьма важно, вход на все это крутое мероприятие свободный по предварительной регистрации. С нетерпением жду предстоящей субботы и приглашаю вас на этот замечательный DS-интенсив. До скорой встречи!

https://datafest.ru/siberia/
🔎Аналитика данных и Data Science: сходства и различия

Почему Data Science – это больше, чем просто анализ информации, чем Data Scientist отличается от Data Analyst’а, в каких случаях и для чего бизнесу необходимы оба этих профессионала.

https://chernobrovov.ru/articles/analitika-dannyh-i-data-science-shodstva-i-razlichiya.html
Правительство Москвы и высокотехнологичные компании России (Mail.ru, Ростелеком, ВТБ, Сбербанк, Лаборатория Касперского) проводят целую серию командных хакатонов: от поиска уязвимостей в финансовых системах до умного города. В хакатоне есть трек «Искусственный интеллект».
Вместе с единомышленниками вы можете воплотить свою идею, реализовать пилотный проект, запустить собственный бизнес или получить работу в компании мечты. Подавайте заявку и сделайте наш мир лучше вместе с Urban.Tech.Moscow! ❤️
http://innoagency.ru/utm/
🎁 Друзья и коллеги по Data Science и маркетингу, ловите приятный бонус: скидку 15% на очень крутое событие - МетаМаркетинг, ежегодную профессиональную конференцию по аналитике и маркетинговой аналитике.
Целых 2 дня, 14-15 ноября 2019, на 5 площадках московского Grand Ballroom (Шлюзовая наб., 2/1с1, м. Павелецкая) мы будем говорить про алгоритмический маркетинг, A/B-тестирование, маркетинговую аналитику, оптимизацию стратегий, поведение потребителей и применение Data Science в малом бизнесе. 65 топовых спикеров из крупнейших data-driven компаний (Ebay, Netflix, Яндекс, X5 Retail Group), ИТ-стартапов, а также ведущих университетов (МФТИ, MIT, РШЭ) расскажут о новых маркетинговых трендах и реальных кейсах использования Data Science, Machine Learning и других методов Artificial Intelligence. Также нас ждет целая серия прикладных воркшопов с разработкой в режиме онлайн.
Увлекательные доклады, захватывающие дискуссии, обмен опытом и неформальное общение в кругу единомышленников будут полезны каждому, кто хочет быть в курсе современных трендов Data Science и практического маркетинга, от инженера до руководителя. Выбирайте самое интересное из программы конференции, регистрируйтесь со скидкой 15% на покупку билета по промокоду MM-TcQPcRL251-15 и участвуйте! До встречи в четверг, 14 ноября в Grand Ballroom!
Учебный год стартовал: сентябрь пролетел стремительно, принеся нам множеством интересных конференций, митапов, мастер-классов и прочих ивентов по Big Data, Data Science и Machine Learning.

В октябре скучать тоже не придется: нас ждет много интересных событий, научно-практических форумов и тематических мероприятий по анализу данных, машинному обучения и другим инструментам искусственного интеллекта:

1️⃣
04.10.2019, Москва – прикладной форум «AI Stories: когда Data Science говорит на языке бизнеса» (https://techdaysrussia.ru/ai/) - компании из разных отраслей делятся своим опытом по использованию больших данных для обучения AI-моделей и решения широкого спектра задач

2️⃣
08.10.2019, Москва – международная конференция «Big Data Days 2019» по большим данным,
науке о данных и искусственному интеллекту (https://bigdatadays.ru/ru/)

3️⃣
15.10.2019, Москва – ежегодная конференция «Loginom Day 2019» по Data Science, подготовленная профессионалами для профессионалов (https://day.loginom.ru/)

4️⃣
15.10.2019, Санкт-Петербург – научно-практический форум «BIG DATA» по большим данным
и интеллектуальной аналитике впервые состоится в СПБ (https://www.osp.ru/iz/bigdata2019-spb)

5️⃣
17.10.2019, Москва – «Data Start: Big Data, Machine Learning и Neural Network» конференция – выставка уникальных разработок в сфере BigData, продвинутой аналитики и машинного обучения, подробные разборы новейших примеров успешного применения технологий настоящего и будущего (https://datastart.ru/)

6️⃣
17.10.2019, Москва – профессиональная конференция «Системы искусственного интеллекта 2019» от TAdviser, экспертного центра по вопросам автоматизации государства и бизнеса в России (http://www.tadviser.ru/index.php/Статья:Конференция_Искусственный_интеллект_2019)

7️⃣
23.10.2019, Москва – прикладной форум «Digital City Forum РБК», в отдельной секции которого будут обсуждаться проблемы искусственного интеллекта и его практического применения в бизнесе и цифовизации городской инфраструктуры (https://www.rbc.ru/digital-forum)
 
Напомню, что на многие из этих событий можно попасть бесплатно по предварительной регистрации в качестве слушателя. Участвуйте, делитесь опытом и повышайте свой профессиональный уровень в Big Data Science!