Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Когда data science была представлена , как отдельная дисциплина в науке?
Anonymous Quiz
25%
1967
55%
1988
14%
1966
5%
1904
Аналитика данных используется во многих областях и требует людей с самым разным бэкграундом, поэтому в Data Science каждый может найти себя.

7 апреля в Нетологии пройдет «Онлайн-день открытых дверей и презентация новых программ по Аналитике и Data Science», на котором подробно расскажут о профессиях в этой сфере — data scientist, продуктовый аналитик, игровой аналитик, дата-журналист, маркетолог-аналитик, инженер данных, аналитик bi, — и где они нужны.

Вы найдете подходящее именно вам направление, выберете для себя трек развития карьеры и узнаете, какие шаги нужно сделать для входа в новую профессию.

Регистрируйтесь и постройте свой план карьерного роста ↓
https://netolo.gy/gnG
Алгоритм обучения многослойной нейронной сети методом обратного распространения ошибки (Backpropagation).
Тема нейронных сетей была уже ни раз освещена на хабре, однако сегодня я бы хотел познакомить читателей с алгоритмом обучения многослойной нейронной сети методом обратного распространения ошибки и привести реализацию данного метода.

Сразу хочу оговориться, что не являюсь экспертом в области нейронных сетей, поэтому жду от читателей конструктивной критики, замечаний и дополнений.
Читать статью.
​​Основы ИНС - Очень полезная статья для тех , кто ещё не знаком или мало знаком со сферой ИНС (искусственых нейронных сетей).
Почему Python используется для машинного обучения?
Скорее всего, вы знаете, что Python — это самый популярный высокоуровневый язык программирования с динамической семантикой. Он довольно прост для работы и чтения: его использование снижает стоимость разработки и обслуживания программ.
Подробнее...
Станьте топовым менеджером big data всего за 4 месяца! На онлайн-курсе вы научитесь:

- Разбираться в технологиях big data. Познакомитесь с подходом lean, методологией data mining и облачными решениями для работы с большими данными.
- Управлять проектом и командой. Сможете подбирать инструменты и команду для конкретного проекта big data, ставить задачи разработчикам и управлять сроками.
- Внедрять подход data driven. Узнаете, как принимать стратегические решения на основе данных с интеграцией аналитических отчётов в ключевые бизнес-процессы компании.
- Оценивать результаты. Получите список метрик, которые помогут оценить качество готовой модели и эффективность работы команды.
- Предлагать решения, основанные на больших данных, и презентовать их руководству. Будете составлять эффектные бизнес-кейсы и графики. Узнаете, как убедить руководство внедрить новую технологию.

Переходите на сайт: https://clc.am/no-txQ, заполняйте заявку и регистрируйся на курс!
Оптимизация производительности MySQL сервера
От скорости работы баз данных (БД) зависит быстрота отклика сайта. Ведь замедленная обработка запросов влияет на PHP, следовательно — накапливается огромное количество операций, с которыми сервер может не справиться.
Управлять данным процессом позволяет использование систем управления базами данных или СУБД. Одной из самых широко применяемых СУБД является MySQL — ПО с открытым исходным кодом, созданное компанией MySQL AB (Oracle) ещё в 1995 году. Оптимизация MySQL позволяет избежать проблем с производительностью сервера и значительно ускорить интернет-ресурс.
В статье представлены варианты повышения производительности баз данных MySQL с помощью специального скрипта, а также указаны параметры настройки, на которые необходимо обратить внимание.
Статья.
Сочные скидки до 40% от онлайн-университета SF Education.

Выбирай программу на свой вкус https://bit.ly/3moWT4F и получай аппетитную скидку с 8 по 12 апреля!

На все курсы по финансам, бизнесу и аналитике есть возможность получить дополнительную выгоду до 80%:

⁃ скидка до 40%
⁃ сashback 30% при оплате картой Тинькофф
⁃ вычет 13% НДФЛ на обучение
⁃ беспроцентная рассрочка от банков-партнеров

Программы подойдут:
— тем, кто хочет освоить новую профессию с нуля;
— специалистам, которые хотят восполнить теоретическую базу и получить больше практических навыков;
— руководителям, которые хотят повысить продуктивность и подняться по карьерной лестнице.

А для подписчиков канала мы собрали специальную подборку:

⁃ программа «Бизнес-аналитик (Data Analyst)»
⁃ курс «Data Science academy»
⁃ курс «Excel Academy»

Все, что вам нужно сделать — оставить заявку на сайте https://bit.ly/3moWT4F
Обучение нейросети с учителем, без учителя, с подкреплением — в чем отличие? Какой алгоритм лучше?
Статья.
Изучение data science c нуля: этапы и вехи
В соответствии с концепцией спирального подхода к обучению, привожу поэтапный план освоения data science. План составлен так, чтобы каждый этап делал учащегося в той или иной степени лучше подготовленным к выполнению реальных задач. Такой подход вдохновлен идеологией Agile в том смысле, что сколько бы времени вы ни уделили обучению и в какой бы момент ни остановились, у вас будет наиболее востребованный набор знаний из возможных к освоению за такое время.
Полная статья
​​Потоки и многопоточность / для начинающих
Многопоточность очень ценится в кругу дата сайентистов, т.к. позволяет анализировать и обрабатывать огромные объёмы данных используя все возможные ресурсы вычислительной машины , тем самым сокарщая время обработки данных.
Про многопототчность есть прекрасная статья, где разъясняется эта тема на примере ЯП Python.
https://pythonru.com/uroki/potoki-i-mnogopotochnost-dlja-nachinajushhih
Топ-9 диаграмм для визуализации данных

Зачем нужна визуализация данных?
Люди лучше воспринимают и запоминают данные в визуальном формате. Информация становится привычнее и понятнее, если подать ее в виде красивых схем, графиков и диаграмм.
Данные визуализируются, чтобы в моменте получить представление о явлении или состоянии процесса, который мы анализируем. Визуализация данных позволяет нам сделать фотографию ситуации «здесь и сейчас», не погружаясь в цифры и таблицы.
Преобразование необработанной информации в графический формат помогает доступно объяснять сложные вещи для решения таких бизнес-задач, как анализ эффективности направлений деятельности, анализ динамики выполнения задач, анализ достижения целей, анализ ценообразования в разных сферах деятельности: маркетинг, продажи, производство. Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора и грамотного использования типов графиков и диаграмм.

1. Круговая Диаграмма
Круговая диаграмма – это один из наиболее распространенных и простых способов графического представления количественных данных. Такие диаграммы легко считывать и воспринимать, потому что отношения частей от целого показаны на ней простым и наглядным образом. Круговые диаграммы идеально подходят для того, чтобы быстро сформировать представление о пропорциональном распределении данных. На нашем примере – распределение объемов выбросов CO2 в разрезе секторов экономики.
2. Столбиковая Диаграмма
Столбиковая диаграмма или гистограмма – еще один популярный способ визуализации данных для быстрого восприятия информации. Гистограммы преобразовывают набор данных в прямоугольные столбцы, высоты или длины которых пропорциональны величинам, которые они отображают. Такие диаграммы значительно упрощают сравнение сопоставимых данных одной категории в рамках ограниченного периода времени. Пример — изменение численности населения страны за конкретный период или на нашем скриншоте – динамика 3. 3. Линейный график
Как и столбиковые диаграммы, линейные графики помогают визуализировать данные в компактном и точном формате, что позволяет легко воспринимать информацию, отмечать тренды или соотношения показателей (при использовании нескольких линий). Линейные графики используются для отображения результирующих данных относительно непрерывной переменной – чаще всего времени. В этом типе визуализации необходимо правильное использование разных цветов, чтобы сделать анализ информации еще проще для пользователей. На нашем примере – линейный график, показывающий число прибывших и покинувших Арабские страны пассажиров с 2005 по 2018 гг.
Остальные 6 по ссылке...
​​🚀 Если очень захотеть, можно и полететь в космос, и выучить английский. И если первое требует много времени и сил, то со вторым всё гораздо проще!

В честь Дня космонавтики с 16 по 19 апреля Премиум-доступ к Puzzle English (@puzzleng) дешевле на 66%🔥

Вы получите неограниченный доступ к тысячам упражнений по грамматике и аудированию, видеоурокам, играм, песням и книгам значительно дешевле обычной цены. Подойдёт и новичкам, и продвинутым.

Узнать больше о сервисе и получить доступ:
https://u.to/Z08-Gw
​​Методы сортировки данных. Алгоритмы поиска и сортировки
Алгоритмы сортировки данных широко используются в программировании для решения различных задач. В этой статье мы рассмотрим несколько основных алгоритмов сортировки данных в массиве.
/ Статья /
​​Гистограммы. Что это? Как построить? Как представить данные? Как провести анализ?
/ Статья /