Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​2021 г. Научные тенденции в области данных

2020 год был сложным для всех. Несмотря на то, что он был полон неожиданных событий, он позволил внедрить новые разработки в цифровой мир.
Про эти нововведения можете почитать в статье ниже.
[ Статья ]
Что входит в must-have умения специалиста Машинного обучения?

11 мая Дмитрий Сергеев, Senior Data Scientist в Oura, расскажет, на какие навыки обращают внимание работодатели и как их тренировать. Дмитрий поделится своим опытом и проведет обзор рынка вакансий в Data Science. Также вы познакомитесь с программой и особенностями онлайн-курса «Machine Learning. Professional», форматом обучения OTUS и сможете задать свои вопросы эксперту. Ждем тех, кто уже начал осваиваться в Data Science и хочет получить знания, необходимые Middle специалисту.

Для участия регистрируйтесь на вебинар https://otus.pw/2wUl/
​​Как устроены камеры с искусственным интеллектом

В каждой умной камере есть встроенная видеоаналитика, сегодня чаще всего здесь используются нейросети глубокого обучения или искусственный интеллект. Это стало возможным благодаря увеличению мощности процессоров видеокамер, раньше видеоаналитика могла существовать только на серверах.
[ Статья ]
​​Нейронные сети: распознавание образов и изображений c помощью ИИ
ИНС (искусственные нейросети) – это математическая модель функционирования традиционных для живых организмов нейросетей, которые представляют собой сети нервных клеток. Как и в биологическом аналоге, в искусственных сетях основным элементом выступают нейроны, соединенные между собой и образующие слои, число которых может быть разным в зависимости от сложности нейросети и ее назначения (решаемых задач).
[ Статья ]
Сбер приглашает на свою первую масштабную технологическую конференцию - SmartDev. Сбер представит свои новые возможности для разработчиков, презентует новые условия и возможности сервиса SberCloud.Advanced.

20 мая
👨‍💻 Онлайн и бесплатно
🎯 Регистрация

Шесть параллельных стримов от шести технологических стеков Сбера. 50+ спикеров, которые поделятся опытом и представят новые решения для разработчиков, аналитиков и специалистов по Data Science.

Один из стримов будет посвящен облачной платформе от Сбера - SberCloud. Команда представит новые возможности SberCloud.Advanced — самой широкой линейки платформенных сервисов в России. Теперь все они доступны для физических лиц, через быстрый и удобный self-service.

Вы узнаете, как создавать различные компоненты приложения с помощью всех необходимых платформ облака. Поговорим про работу Apache Spark c Big Data в кластере SberCloud и про создание инфраструктуры с помощью Terraform по принципу Infrastructure-as-Code.

Зарегистрируйтесь, чтобы принять участие.
Будущее рядом — освой профессию Data Scientist

Год обучения Бесплатно!!!

Раньше мы с интересом смотрели фильмы про искусственный интеллект и гадали, как же это пришло в голову сценаристам и режиссёрам.
Но в реалиях настоящей жизни искусственный интеллект — это реальность, которая стремительно врывается в нашу жизнь. Незаменимый помощник Data Scientist — специалист по машинному обучению, который выбирает архитектуру и обучающие алгоритмы, для работы с этими данными.

И у тебя как раз есть шанс стать тем самым незаменимым специалистом благодаря курсу от Skillbox «Профессия Data Scientist».

На курсе тебе предстоит научиться очень многим интересным вещам: от программирования на Python и визуализации данных до программирования на R и применения нейронных сетей для решения реальных задач.

После прохождения курса не стоит переживать о том, где найти работу. Эти заботы берут на себя опытные HR-специалисты.
Открой мир будущего — переходи по ссылке ▶️ https://clc.am/ZJA5LQ
​​Потоки и многопоточность / для начинающих
Многопоточность очень ценится в кругу дата сайентистов, т.к. позволяет анализировать и обрабатывать огромные объёмы данных используя все возможные ресурсы вычислительной машины , тем самым сокарщая время обработки данных.
Про многопототчность есть прекрасная статья, где разъясняется эта тема на примере ЯП Python.
[ Статья ]
Влияние искусственного интеллекта в современном трейдинге

Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015 года трейдерам и их ботам приходится конкурировать уже с искусственным интеллектом.
[ Статья ]
20 мая состоится технологическая онлайн-конференция - SmartDev

Это первая масштабная конференция от Сбера, на которой соберутся топовые спикеры из IT-компаний, чтобы за один день рассказать все о новых сервисах и инструментах разработки в формате dev to dev.

Вас ждут прикладные выступления на темы:

💥 Десятки новых APIs, SDKs, AR/VR, инструменты разработки приложений для виртуальных ассистентов Салют и их монетизация.
💥 Сервисы Platform V полноценный PaaS от Сбера
💥 50+ сервисов для разработки от SberCloud
💥 Machine Learning на единственной в мире облачной платформе с распределенным обучением на 1000+ GPU
💥 Использование средств разработки Intel OneAPI в Sbercloud ML Space

Участники, которые будут в числе первых семи тысяч зарегистрированных на конференцию SmartDev и на платформе SmartMarket - получат промокод на заказ еды от Delivery Club на 500 руб в день конференции.

Участие бесплатное, регистрация по ссылке.

Присоединяйтесь!
Вытаскиваем данные из Instagram
Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе.
[ Статья ]
​​⚠️Переобучение нейросетей: в чем проблема и как ее решить

'''С момента описания первого искусственного нейрона Уорреном Мак-Каллоком и Уолтером Питтсом прошло более пятидесяти лет. С тех пор многое изменилось, и сегодня нейросетевые алгоритмы применяются повсеместно. И хотя нейронные сети способны на многое, исследователи при работе с ними сталкиваются с рядом трудностей: от переобучения до проблемы «черного ящика»'''.


Главная проблема нейросетей — переобучение. Оно заключается в том, что сеть «запоминает» ответы вместо того, чтобы улавливать закономерности в данных. Наука поспособствовала появлению на свет нескольких методов борьбы с переобучением: сюда относятся, например, регуляризация, нормализация батчей, наращивание данных и другие. Иногда переобученная модель характеризуется большими абсолютными значениями весов.

Механизм этого явления примерно такой: исходные данные нередко сильно многомерны (одна точка из обучающей выборки изображается большим набором чисел), и вероятность того, что наугад взятая точка окажется неотличимой от выброса, будет тем больше, чем больше размерность. Вместо того, чтобы «вписывать» новую точку в имеющуюся модель, корректируя веса, нейросеть как будто придумывает сама себе исключение: эту точку мы классифицируем по одним правилам, а другие — по другим. И таких точек обычно много.

📌Очевидный способ борьбы с такого рода переобучением – регуляризация весов. Она состоит либо в искусственном ограничении на значения весов, либо в добавлении штрафа в меру ошибки на этапе обучения. Такой подход не решает проблему полностью, но чаще всего улучшает результат.

📌Второй способ основан на ограничении выходного сигнала, а не значений весов, — речь о нормализации батчей. На этапе обучения данные подаются нейросети пачками — батчами. Выходные значения для них могут быть какими угодно, и тем их абсолютные значения больше, чем выше значения весов. Если из каждого из них мы вычтем какое-то одно значение и поделим результат на другое, одинаково для всего батча, то мы сохраним качественные соотношения (максимальное, например, все равно останется максимальным), но выход будет более удобным для обработки его следующим слоем.

📌Третий подход работает не всегда. Как уже говорилось, переобученная нейросеть воспринимает многие точки как аномальные, которые хочется обрабатывать отдельно. Идея состоит в наращивании обучающей выборки, чтобы точки были как будто той же природы, что и исходная выборка, но сгенерированы искусственно. Однако тут сразу рождается большое число сопутствующих проблем: подбор параметров для наращивания выборки, критическое увеличение времени обучения и прочие.
Получи ультрасовременное образование из любой точки мира! Четырехлетняя программа бакалавриата по аналитике данных и машинному обучению это:
→ дистанционное образование за 4 года;
→ портфолио, стажировки и трудоустройство;
→ возможность получить 2 диплома;
→ отсрочка от армии.

Специалисты Data Science & Machine Learning находят закономерности в данных и делают выводы. Например, какой способ производства на предприятии тратит меньше энергии, какие товары компании самые популярные или когда в экономике может случиться дефолт. А также создают алгоритмы обучаемого искусственного интеллекта для нейросетей, голосовых помощников, программ распознавания лиц и чат-ботов.

Вот, в каких сферах ты сможешь работать после окончания вуза:
→ Разработка игр.
→ Информационные технологии.
→ Медицина.
→ Финансы.

Получи больше информации, переходи по ссылке: https://clc.am/cJraRQ
Разбор реальной data science задачи
В этом ролике автор разбирает реальную задачу, в котором нужно отфильтровать негативные комментарии и вычислить их кол-во с помощью нейросети обученный на сэмпл-данных.
[ Видео Материал ]
Бесплатный сервис Битрикс24 мощно обновился.

В продукт добавили более 50 новинок и обновлений, которые помогут бизнесу расти и развиваться в сложных условиях.
Во-первых, появились совершенно новые продукты и инструменты: онлайн-редактор для совместной работы с документами в режиме реального времени, официальная интеграция CRM и WhatsApp (чтобы принимать оплату прямо в переписке), организация доставки товаров прямо из CRM, новая улучшенная работа с большим количеством проектов сразу, смарт-процессы для автоматизации работы департаментов.

Во-вторых, ВСЕ обновления уже выпущены и доступны предпринимателям прямо сейчас.

Кликайте на ссылку и смотрите, какие обновления вас ждут: https://www.bitrix24.ru/~meCPI
Аналитик в автоматизации — кто он и чем занимается
Жизнь, работодатели и процессы придумали много мест, где может быть полезен человек-аналитик. То есть такой человек, который углубится в проблему и подумает, как надо. Однако областей аналитики много, что понять, кто есть кто и кем хочется быть, может быть сложно. Как и понять, куда развиваться. 
Как главный аналитик в ADV/web-engineering co, я регулярно отвечаю на подобные вопросы коллег и соискателей на собеседованиях. Надеюсь, что эта статья поможет сформировать представление о возможном развитии и ожидания от работы аналитиком в той или иной компании.
[ Статья ]