🔥Большой гайд по библиотеке pandas: анализ данных на Python
[ Статья ]
[ Статья ]
Telegraph
Введение в pandas: анализ данных на Python
pandas это высокоуровневая Python библиотека для анализа данных. Почему я её называю высокоуровневой, потому что построена она поверх более низкоуровневой библиотеки NumPy (написана на Си), что является большим плюсом в производительности. В экосистеме Python…
Потоки и многопоточность / для начинающих
Многопоточность очень ценится в кругу дата сайентистов, т.к. позволяет анализировать и обрабатывать огромные объёмы данных используя все возможные ресурсы вычислительной машины , тем самым сокарщая время обработки данных.
Про многопототчность есть прекрасная статья, где разъясняется эта тема на примере ЯП Python.
[ Статья ]
Многопоточность очень ценится в кругу дата сайентистов, т.к. позволяет анализировать и обрабатывать огромные объёмы данных используя все возможные ресурсы вычислительной машины , тем самым сокарщая время обработки данных.
Про многопототчность есть прекрасная статья, где разъясняется эта тема на примере ЯП Python.
[ Статья ]
Влияние искусственного интеллекта в современном трейдинге
Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015 года трейдерам и их ботам приходится конкурировать уже с искусственным интеллектом.
[ Статья ]
Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015 года трейдерам и их ботам приходится конкурировать уже с искусственным интеллектом.
[ Статья ]
Telegraph
Участие искусственного интеллекта в современном трейдинге
Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015…
20 мая состоится технологическая онлайн-конференция - SmartDev
Это первая масштабная конференция от Сбера, на которой соберутся топовые спикеры из IT-компаний, чтобы за один день рассказать все о новых сервисах и инструментах разработки в формате dev to dev.
Вас ждут прикладные выступления на темы:
💥 Десятки новых APIs, SDKs, AR/VR, инструменты разработки приложений для виртуальных ассистентов Салют и их монетизация.
💥 Сервисы Platform V полноценный PaaS от Сбера
💥 50+ сервисов для разработки от SberCloud
💥 Machine Learning на единственной в мире облачной платформе с распределенным обучением на 1000+ GPU
💥 Использование средств разработки Intel OneAPI в Sbercloud ML Space
Участники, которые будут в числе первых семи тысяч зарегистрированных на конференцию SmartDev и на платформе SmartMarket - получат промокод на заказ еды от Delivery Club на 500 руб в день конференции.
Участие бесплатное, регистрация по ссылке.
Присоединяйтесь!
Это первая масштабная конференция от Сбера, на которой соберутся топовые спикеры из IT-компаний, чтобы за один день рассказать все о новых сервисах и инструментах разработки в формате dev to dev.
Вас ждут прикладные выступления на темы:
💥 Десятки новых APIs, SDKs, AR/VR, инструменты разработки приложений для виртуальных ассистентов Салют и их монетизация.
💥 Сервисы Platform V полноценный PaaS от Сбера
💥 50+ сервисов для разработки от SberCloud
💥 Machine Learning на единственной в мире облачной платформе с распределенным обучением на 1000+ GPU
💥 Использование средств разработки Intel OneAPI в Sbercloud ML Space
Участники, которые будут в числе первых семи тысяч зарегистрированных на конференцию SmartDev и на платформе SmartMarket - получат промокод на заказ еды от Delivery Club на 500 руб в день конференции.
Участие бесплатное, регистрация по ссылке.
Присоединяйтесь!
Вытаскиваем данные из Instagram
Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе.
[ Статья ]
Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе.
[ Статья ]
Хабр
Вытаскиваем данные из Instagram
Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе. Intro При фазовом переходе из состояния Employed в...
⚠️Переобучение нейросетей: в чем проблема и как ее решить
'''С момента описания первого искусственного нейрона Уорреном Мак-Каллоком и Уолтером Питтсом прошло более пятидесяти лет. С тех пор многое изменилось, и сегодня нейросетевые алгоритмы применяются повсеместно. И хотя нейронные сети способны на многое, исследователи при работе с ними сталкиваются с рядом трудностей: от переобучения до проблемы «черного ящика»'''.
Главная проблема нейросетей — переобучение. Оно заключается в том, что сеть «запоминает» ответы вместо того, чтобы улавливать закономерности в данных. Наука поспособствовала появлению на свет нескольких методов борьбы с переобучением: сюда относятся, например, регуляризация, нормализация батчей, наращивание данных и другие. Иногда переобученная модель характеризуется большими абсолютными значениями весов.
Механизм этого явления примерно такой: исходные данные нередко сильно многомерны (одна точка из обучающей выборки изображается большим набором чисел), и вероятность того, что наугад взятая точка окажется неотличимой от выброса, будет тем больше, чем больше размерность. Вместо того, чтобы «вписывать» новую точку в имеющуюся модель, корректируя веса, нейросеть как будто придумывает сама себе исключение: эту точку мы классифицируем по одним правилам, а другие — по другим. И таких точек обычно много.
📌Очевидный способ борьбы с такого рода переобучением – регуляризация весов. Она состоит либо в искусственном ограничении на значения весов, либо в добавлении штрафа в меру ошибки на этапе обучения. Такой подход не решает проблему полностью, но чаще всего улучшает результат.
📌Второй способ основан на ограничении выходного сигнала, а не значений весов, — речь о нормализации батчей. На этапе обучения данные подаются нейросети пачками — батчами. Выходные значения для них могут быть какими угодно, и тем их абсолютные значения больше, чем выше значения весов. Если из каждого из них мы вычтем какое-то одно значение и поделим результат на другое, одинаково для всего батча, то мы сохраним качественные соотношения (максимальное, например, все равно останется максимальным), но выход будет более удобным для обработки его следующим слоем.
📌Третий подход работает не всегда. Как уже говорилось, переобученная нейросеть воспринимает многие точки как аномальные, которые хочется обрабатывать отдельно. Идея состоит в наращивании обучающей выборки, чтобы точки были как будто той же природы, что и исходная выборка, но сгенерированы искусственно. Однако тут сразу рождается большое число сопутствующих проблем: подбор параметров для наращивания выборки, критическое увеличение времени обучения и прочие.
'''С момента описания первого искусственного нейрона Уорреном Мак-Каллоком и Уолтером Питтсом прошло более пятидесяти лет. С тех пор многое изменилось, и сегодня нейросетевые алгоритмы применяются повсеместно. И хотя нейронные сети способны на многое, исследователи при работе с ними сталкиваются с рядом трудностей: от переобучения до проблемы «черного ящика»'''.
Главная проблема нейросетей — переобучение. Оно заключается в том, что сеть «запоминает» ответы вместо того, чтобы улавливать закономерности в данных. Наука поспособствовала появлению на свет нескольких методов борьбы с переобучением: сюда относятся, например, регуляризация, нормализация батчей, наращивание данных и другие. Иногда переобученная модель характеризуется большими абсолютными значениями весов.
Механизм этого явления примерно такой: исходные данные нередко сильно многомерны (одна точка из обучающей выборки изображается большим набором чисел), и вероятность того, что наугад взятая точка окажется неотличимой от выброса, будет тем больше, чем больше размерность. Вместо того, чтобы «вписывать» новую точку в имеющуюся модель, корректируя веса, нейросеть как будто придумывает сама себе исключение: эту точку мы классифицируем по одним правилам, а другие — по другим. И таких точек обычно много.
📌Очевидный способ борьбы с такого рода переобучением – регуляризация весов. Она состоит либо в искусственном ограничении на значения весов, либо в добавлении штрафа в меру ошибки на этапе обучения. Такой подход не решает проблему полностью, но чаще всего улучшает результат.
📌Второй способ основан на ограничении выходного сигнала, а не значений весов, — речь о нормализации батчей. На этапе обучения данные подаются нейросети пачками — батчами. Выходные значения для них могут быть какими угодно, и тем их абсолютные значения больше, чем выше значения весов. Если из каждого из них мы вычтем какое-то одно значение и поделим результат на другое, одинаково для всего батча, то мы сохраним качественные соотношения (максимальное, например, все равно останется максимальным), но выход будет более удобным для обработки его следующим слоем.
📌Третий подход работает не всегда. Как уже говорилось, переобученная нейросеть воспринимает многие точки как аномальные, которые хочется обрабатывать отдельно. Идея состоит в наращивании обучающей выборки, чтобы точки были как будто той же природы, что и исходная выборка, но сгенерированы искусственно. Однако тут сразу рождается большое число сопутствующих проблем: подбор параметров для наращивания выборки, критическое увеличение времени обучения и прочие.
От дружелюбного ИИ к монетизации и одержимости имиджем: почему бывший стартап Илона Маска OpenAI предал свои идеалы
[ Статья ]
[ Статья ]
vc.ru
От дружелюбного ИИ к монетизации и одержимости имиджем: почему бывший стартап Илона Маска OpenAI предал свои идеалы — Будущее на…
Компания хотела стать первой в создании безопасного искусственного интеллекта и выбрала закрытый и коммерческий путь вместо прозрачности и объединения усилий с другими разработчиками. Своё недоверие проекту высказал Илон Маск.
Получи ультрасовременное образование из любой точки мира! Четырехлетняя программа бакалавриата по аналитике данных и машинному обучению это:
→ дистанционное образование за 4 года;
→ портфолио, стажировки и трудоустройство;
→ возможность получить 2 диплома;
→ отсрочка от армии.
Специалисты Data Science & Machine Learning находят закономерности в данных и делают выводы. Например, какой способ производства на предприятии тратит меньше энергии, какие товары компании самые популярные или когда в экономике может случиться дефолт. А также создают алгоритмы обучаемого искусственного интеллекта для нейросетей, голосовых помощников, программ распознавания лиц и чат-ботов.
Вот, в каких сферах ты сможешь работать после окончания вуза:
→ Разработка игр.
→ Информационные технологии.
→ Медицина.
→ Финансы.
Получи больше информации, переходи по ссылке: https://clc.am/cJraRQ
→ дистанционное образование за 4 года;
→ портфолио, стажировки и трудоустройство;
→ возможность получить 2 диплома;
→ отсрочка от армии.
Специалисты Data Science & Machine Learning находят закономерности в данных и делают выводы. Например, какой способ производства на предприятии тратит меньше энергии, какие товары компании самые популярные или когда в экономике может случиться дефолт. А также создают алгоритмы обучаемого искусственного интеллекта для нейросетей, голосовых помощников, программ распознавания лиц и чат-ботов.
Вот, в каких сферах ты сможешь работать после окончания вуза:
→ Разработка игр.
→ Информационные технологии.
→ Медицина.
→ Финансы.
Получи больше информации, переходи по ссылке: https://clc.am/cJraRQ
Разбор реальной data science задачи
В этом ролике автор разбирает реальную задачу, в котором нужно отфильтровать негативные комментарии и вычислить их кол-во с помощью нейросети обученный на сэмпл-данных.
[ Видео Материал ]
В этом ролике автор разбирает реальную задачу, в котором нужно отфильтровать негативные комментарии и вычислить их кол-во с помощью нейросети обученный на сэмпл-данных.
[ Видео Материал ]
YouTube
Разбор реальной data science задачи
🔥 Индивидуальная программа по обучению data science под вашу цель с моей менторской поддержкой до результата:
https://ershov.io/dsprogram?utm_source=youtube&utm_medium=video&utm_content=yt16
Тут я рассказываю почему я создал эту программу, для кого она…
https://ershov.io/dsprogram?utm_source=youtube&utm_medium=video&utm_content=yt16
Тут я рассказываю почему я создал эту программу, для кого она…
Почему машинному обучению с трудом дается причинно-следственная связь?
[ Статья ]
[ Статья ]
Хабр
Почему машинному обучению с трудом дается причинно-следственная связь?
Эта статья является частью наших обзоров исследовательских работ в области ИИ , серии публикаций, в которых исследуются последние открытия в области искусственного интеллекта. Просматривая следующую...
Бесплатный сервис Битрикс24 мощно обновился.
В продукт добавили более 50 новинок и обновлений, которые помогут бизнесу расти и развиваться в сложных условиях.
Во-первых, появились совершенно новые продукты и инструменты: онлайн-редактор для совместной работы с документами в режиме реального времени, официальная интеграция CRM и WhatsApp (чтобы принимать оплату прямо в переписке), организация доставки товаров прямо из CRM, новая улучшенная работа с большим количеством проектов сразу, смарт-процессы для автоматизации работы департаментов.
Во-вторых, ВСЕ обновления уже выпущены и доступны предпринимателям прямо сейчас.
Кликайте на ссылку и смотрите, какие обновления вас ждут: https://www.bitrix24.ru/~meCPI
В продукт добавили более 50 новинок и обновлений, которые помогут бизнесу расти и развиваться в сложных условиях.
Во-первых, появились совершенно новые продукты и инструменты: онлайн-редактор для совместной работы с документами в режиме реального времени, официальная интеграция CRM и WhatsApp (чтобы принимать оплату прямо в переписке), организация доставки товаров прямо из CRM, новая улучшенная работа с большим количеством проектов сразу, смарт-процессы для автоматизации работы департаментов.
Во-вторых, ВСЕ обновления уже выпущены и доступны предпринимателям прямо сейчас.
Кликайте на ссылку и смотрите, какие обновления вас ждут: https://www.bitrix24.ru/~meCPI
Аналитик в автоматизации — кто он и чем занимается
Жизнь, работодатели и процессы придумали много мест, где может быть полезен человек-аналитик. То есть такой человек, который углубится в проблему и подумает, как надо. Однако областей аналитики много, что понять, кто есть кто и кем хочется быть, может быть сложно. Как и понять, куда развиваться.
Как главный аналитик в ADV/web-engineering co, я регулярно отвечаю на подобные вопросы коллег и соискателей на собеседованиях. Надеюсь, что эта статья поможет сформировать представление о возможном развитии и ожидания от работы аналитиком в той или иной компании.
[ Статья ]
Жизнь, работодатели и процессы придумали много мест, где может быть полезен человек-аналитик. То есть такой человек, который углубится в проблему и подумает, как надо. Однако областей аналитики много, что понять, кто есть кто и кем хочется быть, может быть сложно. Как и понять, куда развиваться.
Как главный аналитик в ADV/web-engineering co, я регулярно отвечаю на подобные вопросы коллег и соискателей на собеседованиях. Надеюсь, что эта статья поможет сформировать представление о возможном развитии и ожидания от работы аналитиком в той или иной компании.
[ Статья ]
Хабр
Аналитик в автоматизации — кто он и чем занимается
Жизнь, работодатели и процессы придумали много мест, где может быть полезен человек-аналитик. То есть такой человек, который углубится в проблему и подумает, как надо. Однако областей аналитики много,...
Мониторить рынок IT-вакансий проще, когда интересные вакансии сами приходят к тебе.
@GetMeIT_bot подбирает вакансии по твоим предпочтениям: просто настрой фильтры и проверяй входящие.
@GetMeIT_bot подбирает вакансии по твоим предпочтениям: просто настрой фильтры и проверяй входящие.
Всё вокруг автоматизируется и на смену ручному труду приходят машины и алгоритмы. Почти в каждом магазине — кассы самообслуживания, вместо курьеров — роботы, даже новости теперь пишет AI. Кажется, вакансий для простых работяг скоро не будет. Но зато появится еще больший спрос на людей, которые будут разрабатывать и обучать нейросети.
Поэтому, если вы хотите научиться профессии, которая создает будущее — обратите внимание на курс «Дата-сайентист» от SkillFactory. Вы получите сильную теоретическую базу, а затем будете очень много практиковаться. На курсе вы создадите искусственный интеллект, обучите нейронную сеть, будете анализировать данные и строить прогнозные модели.
В SkillFactory можно учиться когда удобно, скорректировать нагрузку или заморозить курс на время, если, например, уезжаете в отпуск. Курс заточен под то, чтобы создать у вас мотивацию не забросить через пару месяцев. Ментор поможет в трудную минуту и ответит на все вопросы. А после окончания курса карьерный центр помогает студентам с трудоустройством.
Все еще сомневаетесь? Почитайте отзывы о Skillfactory на независимых сайтах, там их много и с отличными оценками!
Все подробности по ссылке — https://clc.am/qSVd9Q
До 24 мая по промокоду ДАТА на курс можно записаться со скидкой в 45%
Поэтому, если вы хотите научиться профессии, которая создает будущее — обратите внимание на курс «Дата-сайентист» от SkillFactory. Вы получите сильную теоретическую базу, а затем будете очень много практиковаться. На курсе вы создадите искусственный интеллект, обучите нейронную сеть, будете анализировать данные и строить прогнозные модели.
В SkillFactory можно учиться когда удобно, скорректировать нагрузку или заморозить курс на время, если, например, уезжаете в отпуск. Курс заточен под то, чтобы создать у вас мотивацию не забросить через пару месяцев. Ментор поможет в трудную минуту и ответит на все вопросы. А после окончания курса карьерный центр помогает студентам с трудоустройством.
Все еще сомневаетесь? Почитайте отзывы о Skillfactory на независимых сайтах, там их много и с отличными оценками!
Все подробности по ссылке — https://clc.am/qSVd9Q
До 24 мая по промокоду ДАТА на курс можно записаться со скидкой в 45%
skillfactory.ru
Курс Data Science с нуля - Обучение Data Scientist онлайн - Школа по работе с данными Skillfactory
Курс Data Science онлайн ★ Решаем практические кейсы 20% теории и 80% практики, поддержка менторов и комьюнити курса, портфолио на github к концу обучения, профессия Junior Data Scientist за 1 год ▶ Школа по работе с данными Skillfactory ☎ +7 (495) 291-09
Линейная алгебра для Data Science и Machine Learning
Линейная алгебра в Data Science и Machine Learning является основополагающей. Новички, начинающие свой путь обучения в области Data Science, а также признанные практики должны развить хорошее понимание основных понятий линейной алгебры.
Специально к новому старту курса математика и Machine Learning для Data Science делимся переводом статьи Бенджамина Оби Тайо — физика, кандидата наук и преподавателя Data Science — о том, что нужно знать, чтобы лучше понимать Data Science и Machine Learning
[ Статья ]
Линейная алгебра в Data Science и Machine Learning является основополагающей. Новички, начинающие свой путь обучения в области Data Science, а также признанные практики должны развить хорошее понимание основных понятий линейной алгебры.
Специально к новому старту курса математика и Machine Learning для Data Science делимся переводом статьи Бенджамина Оби Тайо — физика, кандидата наук и преподавателя Data Science — о том, что нужно знать, чтобы лучше понимать Data Science и Machine Learning
[ Статья ]
Хабр
Линейная алгебра для Data Science и Machine Learning
Линейная алгебра в Data Science и Machine Learning является основополагающей. Новички, начинающие свой путь обучения в области Data Science, а также признанные практики должны развить хорошее...
Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT
[ Статья ]
[ Статья ]
Хабр
Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT
Low-precision inference в TensorRT сегодня - мастхэв, бест практис и прочие иностранные. Сконвертить из TensorFlow легко, запустить легко, использовать fp16 легко. Да и КПД выше, чем у pruning или...
🧐Топ 6 библиотек Python для визуализации: какую и когда лучше использовать?
[ Статья ]
[ Статья ]
Хабр
Топ 6 библиотек Python для визуализации: какую и когда лучше использовать?
Перевод подготовлен в рамках курса " Machine Learning. Basic ". Всех желающих приглашаем на открытый онлайн-интенсив «Data Science — это проще, чем кажется» . Поговорим об истории и основных вехах в...
Мозговой имплантат позволяет ощутить предмет, который берет роборука
[ Статья ]
[ Статья ]
Хабр
Мозговой имплантат позволяет ощутить предмет, который берет роборука
Команда Питтсбургского университета в течение двух лет проводила исследования, участник которых — молодой человек, парализованный ниже шеи, — учился управлять роборукой с помощью мозговых...
Puzzle English (@puzzleng) — это сервис, в котором вы можете учить английский онлайн с любого уровня и для любых целей. Тренируйте словарный запас, смотрите отрывки кино и сериалов, или вообще слушайте подкасты для развития понимания языка на слух. А если хочется подтянуть грамматику — то у ребят есть целый каталог игр и тренажеров, с которыми не будет скучно :)
Кстати, после регистрации вы сразу получите бонус — 2 недели Личного Плана. Это такая персональная программа, в которую входит всё, что перечислено выше. А если сервис очень понравится, то ловите промокод
Играйте, тренируйтесь и развивайте свой английский вместе с Puzzle English: https://u.to/fLBUGw
Кстати, после регистрации вы сразу получите бонус — 2 недели Личного Плана. Это такая персональная программа, в которую входит всё, что перечислено выше. А если сервис очень понравится, то ловите промокод
may2021 — он даёт скидку в 66% для покупки премиум-доступа!Играйте, тренируйтесь и развивайте свой английский вместе с Puzzle English: https://u.to/fLBUGw
Music2Dance: как мы пытались научиться танцевать
[ Статья ]
[ Статья ]
Хабр
Music2Dance: как мы пытались научиться танцевать
Всем привет! Меня зовут Владислав Мосин, я учусь на 4-м курсе бакалаврской программы “ Прикладная математика и информатика ” в Питерской Вышке. Прошлым летом вместе с Алиной Плешковой, магистранткой...
DATApedia - канал про Data Science, и все что связано с данными, в котором вы найдете:
— Переведенные зарубежные статьи, которые есть только у нас;
— Возможность предложить нам статью для перевода;
— Полезные видео;
— Профессиональный юмор;
Присоединяйтесь, давайте расти как профессионалы вместе 😉
— Переведенные зарубежные статьи, которые есть только у нас;
— Возможность предложить нам статью для перевода;
— Полезные видео;
— Профессиональный юмор;
Присоединяйтесь, давайте расти как профессионалы вместе 😉