Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🔥 «Люблю» и «ненавижу»: анализ эмоциональной окраски текста с помощью Python

Решаем Data Science-задачу определения эмоциональной окраски текста с помощью Python-библиотеки spaCy и стопки рецензий на фильмы. Сентимент-анализ в действии.
статья
​​🤖💬 Автодополнение длиной в тысячу слов. Что известно о нейросетевой модели GPT-3

О том, что умеет (и чего не может) языковая модель GPT-3, которую называют прорывом в задачах обработки естественного языка.
Статья
Мечтаете стать аналитиком, но не можете пройти отбор в топовую компанию? Тогда 25 августа в 19:00 приходите на бесплатный живой вебинар, где вам ответят на главный вопрос: «За какими аналитиками охотятся работодатели?»

Трансляцию проведёт Андрей Алясов, CEO Changellenge >>, за спиной которого не только работа в A.T. Kearney и Microsoft, но и сотрудничество с половиной топ-50 рейтинга Universum.

На вебинаре вы узнаете:
— какими навыками обладает востребованный аналитик;
— как умение структурно мыслить поможет в карьере;
— как эффективно решать бизнес-задачи;
— как покорить HR- специалиста и получить оффер.

Успейте зарегистрироваться до 25 августа включительно: https://clck.ru/Wx8J6
​​🐍 Линейное программирование. Практика решения задач оптимизации на Python.

Рассмотрим на примере максимизации прибыли характерные особенности задач линейного программирования. В качестве высокоуровневых инструментов – Python, библиотеки SciPy и PuLP.

Статья
Начните работать в Power BI и научитесь строить свой первый отчет. Приходите на бесплатный мастер-класс "Основы анализа данных в Power BI" от онлайн школы IQBI.

За два часа мастер-класса:
🔍Вы научитесь подключаться к данным;
🔍Построите отчёт о продажах компании в Power BI;
🔍Увидите какие факторы влияют на суммы покупок;
🔍Сможете публиковать отчёт в облако, чтобы мониторить бизнес показатели в режиме реального времени.

Это начальные шаги при работе с Power BI и уже после мастер-класса вы сможете внедрить Power BI в свою компанию.

✔️Мастер-класс будет проведен 25 августа
🕖Начинаем в 19:00, заканчиваем к 21:30 по МСК

А тем, кто пройдет мастер класс и выполнит несложное домашнее задание мы дадим доступ к модулю из нашего платного курса, чтобы вы смогли продолжить обучение. Записывайтесь через наши чат-боты по ссылке ниже, куда мы пришлем вам ссылку на трансляцию в день проведения.

Зарегистрироваться: https://bit.ly/2UAweIt
📕🔥Kниги для изучения data science c нуля.
Необходимые базовые навыки
Python & SQL
Математика для анализа данных.

Data Science from Scratch: First Principles with Python Даёт хороший обзор всех основных принципов data science и демонстрацию как простейшим образов реализовать данные вещи с помощью Python. Большая выгода этой книги - изложение порядка решения задач с помощью Python, которое помогает лучше освоить язык программированиея что самом по себе очень ценно.

Statistics Done Wrong .The woefully complete guide by Alex Reinhart
Oтличная иллюстрация того как не стоит применять математические методы проверки гипотез. Автор рассказывает как даже профессиональные учёные всё время ошибаются в их использовании.
​​🤖 Введение в машинное обучение: решаем Titanic на платформе Kaggle

Что такое Kaggle?
Kaggle – площадка, объединяющая соревновательную систему по исследованию данных, образовательный ресурс по искусственному интеллекту и машинному обучению, а также соцсеть специалистов в указанных областях.

статья
Какая команда в SQL используется для получения данных из базы данных
Anonymous Quiz
9%
EXTRACT
76%
SELECT
2%
OPEN
13%
GET
Вы хотите узнать, что такое ETL и почему это является одним из основных понятий в Data Engineering'е.

👉🏻Тогда записывайтесь на demo-занятие в рамках онлайн-курса «DataOps Engineer» 26 августа.

В ходе вебинара мы с вами разберем на практике, как при помощи Airflow создать свой ETL pipeline.

Занятие будет полезно для тех, у кого есть базовые знания в программировании, но ещё нет опыта в работе с данными.

📍Для регистрации пройдите вступительный тест: https://otus.pw/MSTv/
3 Крутых языка для Big Data

Python
Да, 39% набрал один из самых крутых языков программирования, который совсем не случайно оказался популярен и среди людей, работающих с обработкой больших потоков данных. В некотором роде это компромисс между изощренностью R и лёгкостью, которую дарит язык Python. Его популярность обосновывается как раз отсутствием необходимости применения идеальных алгоритмов в угоду возможности включать в работу группу программистов, не имеющих специальных навыков. Если вы хотите начать изучать этот язык, рекомендуем пройти наш онлайн-интесив по питону.

Julia
Язык, который возник совсем недавно, но уже попал на радары всех специалистов Big Data. Он прост и масштабируем, как Python, при этом эффективен, как R. Пока язык Julia молод, ему не хватает мелких доработок, библиотек и элементарной человеческой поддержки, но сомнений в его безоблачном будущем практически нет.

Scala
Если вы никогда ранее не слышали об этом языке, то можете просто ознакомиться со статистическими данными ,чтобы понять насколько успешен сегодня и насколько перспективен завтра будет Scala. Java-подобный язык может быть развёрнут под веб и платформу Android. Но главное его преимущество заключается в удобстве и гибкости, которые не дадут вам многие другие языки из Big Data. Twitter, Siemens и LinkedIn подтверждают.
Как обучить крупную нейросеть, не имея больших ресурсов

Yandex Research рассказал об успешном использовании технологии по децентрализованному обучению нейронных сетей — Distributed Deep Learning in Open Collaborations или сокращённо DeDLOC. Она была создана исследователями из Yandex вместе с командой Hugging Face и University of Toronto. Библиотека и код есть в свободном доступе (ищите ссылки в конце статьи)
Статья
Как с помощю SQL выбрать все записи из таблицы с именем <<Persons>> где <<LastName>> в алфавитном порядке находится между <<Hansen>> и <<Peterson>>
Anonymous Quiz
7%
SELECT LastName>”Hansen” AND LastName< “Petersen” FROM Persons
35%
SELECT FROM Persons WHERE LastName BETWEEN “Hansen” AND “Petersen”.
58%
SELECT * FROM Persons WHERE LastName >”Hansen” AND LastName<“Petersen”
​​🔥Станьте C++ разработчиком с нуля за 10 месяцев с OTUS!

🗣На живых лекциях от практикующих экспертов вы пройдете основы программирования, нюансы разработки на C++ и инструменты для работы в команде. Еженедельные созвоны с ментором позволят вам отточить практические навыки и разобраться в сложных темах.

👉ОСТАВЬТЕ ЗАЯВКУ НА СПЕЦИАЛИЗАЦИЮ C++

📌Хотите ознакомиться с учебным процессом и программой заранее? Регистрируйтесь на бесплатный Demo day

Регистрируйтесь сейчас — напомним перед вебинаром!
​​Искусственный интеллект общего назначения. ТЗ, текущее состояние, перспективы

В наше время словами «искусственный интеллект» называют очень много различных систем — от нейросети для распознавания картинок до бота для игры в Quake. В википедии дано замечательное определение ИИ — это «свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека». То есть из определения явно видно — если некую функцию успешно удалось автоматизировать, то она перестаёт считаться искусственным интеллектом.
Статья
​​🎥 Делаем DeepFake на коленке: пошаговое практическое руководство

Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование.

Статья
6 сентября стартует новый поток курса о данных в энтерпрайзе. Это первая подобная программа в России. Ее разработали создатели MDM- и CDI-решений из компании HFLabs.

🧑‍💻 Для кого

Подойдет всем, кто работает или хочет работать с клиентскими данными в крупной компании.

Специальность не имеет значения: полезно аналитикам, архитекторам, тестировщикам, инженерам по данным.

📚 Программа

Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.

🧙‍♂️ Преподаватели

Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» десяток проектов для крупного бизнеса.

🏃‍♀️ Студенты уже регистрируются

Узнать больше https://bit.ly/3sNsO1W
10 примеров, как искусственный интеллект может изменить ваш образ жизни

Искусственный интеллект в последнее время привлекает все больше внимания, и, если верить Биллу Гейтсу, из всех современных инноваций именно эта имеет наибольший потенциал изменить нашу жизнь сделать ее «более продуктивной, эффективной и вообще легкой».
[ Статья ]
Low-code философия: инструменты, возможности, преимущества.

Low-code философия становится все более популярной альтернативой традиционной разработке. По современным оценкам до 40% отдачи от применения бизнес-аналитики в компаниях даёт гражданский Data Science с применением low-code инструментов.

Один из таких инструментов - low-code платформа Loginom от российской Loginom Company. Платформа Loginom делает продвинутую аналитику доступной бизнес-пользователям. Визуальный конструктор позволяет настроить все процессы анализа: интеграция, подготовка данных, моделирование, визуализация. Loginom сокращает время от тестирования гипотезы до создания работающего бизнес-процесса.

Возможности Loginom:
📍Интеграция данных из различных источников;
📍Быстрая обработка больших массивов данных;
📍Визуальная настройка логики обработки;
📍Машинное обучение и продвинутая аналитика;
📍OLAP-куб и другие способы визуализации;

Преимущества Loginom:
📍Self-service аналитика – самостоятельная настройка без привлечения программистов;
📍Многократное использование разработанных сценариев;
📍Минимизация рутинных процессов;

Попробуйте бесплатно low-code аналитику в облаке!💭
Заполните форму и получите бесплатный доступ к Loginom в облаке на 14 дней.
https://loginom.ru/try-loginom-cloud?utm_source=eSputnik-trigger&utm_medium=email&utm_campaign=Priglashenie_k_testirovaniju_Loginom_v_oblake&utm_content=1253227432&utm_term=test
​​🤖 Машинное обучение для начинающих: алгоритм случайного леса (Random Forest).

В отличие от большинства используемых в машинном обучении методов, алгоритм случайного леса не требует сложной теории. В небольшом обзоре рассказываем про его особенности и возможности применения.

Статья
🐍Скрапинг сайта с помощью Python: гайд для новичков.

В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.

Статья
Управление товарными запасами – кейс Estee Lauder Companies Inc.

Эффективное управление товарными запасами – важная задача ритейл-бизнеса как в оффлайн, так и в онлайн среде. В качестве примера решения этой задачи показателен опыт Estee Lauder Companies Inc. – одной из крупнейших парфюмерно-косметических компаний мира.

В компании управление товарными запасам реализовано на базе аналитической платформы Loginom. Особенность этой платформы - low-code архитектура - визуальная настройка сценария обработки данных из уже готовых компонентов, без необходимости кодирования. Подробный кейс использования Loginom в Estee Lauder Companies Inc. по ссылке.

Отдельно отметим структуру сценария управления товарными запасами на Loginom:
 - 18 измерений;
 - 37 процессов;
 - 68 сценариев обновления данных;
 - 300+ источников данных

При этом эффект от внедрения решения на основе Loginom:
- До 30 секунд – сократилось время обработки аналитических данных.
- На 50 % - снизился уровень товарных запасов.
- На 15 % за 3 месяца – сократились сверхзапасы в онлайн-рознице.

Узнать больше о low-code платформе Loginom можно здесь.
Попробовать платформу Loginom БЕСПЛАТНО в течение 14 дней можно здесь.