Forwarded from Datalytics
Наткнулся на библиотеку pomegranate. Она предоставляет ряд высокоуровневых методов для работы с вероятностными моделями: цепи Маркова, байесовские классификаторы, модели распределения вероятностей, скрытые марковские модели и ещё куча всего. Отдельный плюс библиотеки - доступная документация с множеством примеров, например, вот документация по использованию цепей Маркова со ссылкой на ноутбук с примерами.
https://pomegranate.readthedocs.io/en/latest/index.html
https://pomegranate.readthedocs.io/en/latest/index.html
Forwarded from Datalytics
Оказывается QuantStack (это те товарищи, что сделали Voila и приложили большие усилия в развитию экосистемы Jupyter) сделали виджеты для работы с таблицами внутри ноутбуков. Прелесть не только в том, что можно выводить таблицы, но и редактировать в них данные, а также привязывать данные в таблицах к другим виджетам (слайдерам, инпутам и т.д.)
https://towardsdatascience.com/interactive-spreadsheets-in-jupyter-32ab6ec0f4ff
https://towardsdatascience.com/interactive-spreadsheets-in-jupyter-32ab6ec0f4ff
Medium
Interactive spreadsheets in Jupyter
ipywidgets plays an essential part in the Jupyter ecosystem; it brings interactivity between user and data.
Forwarded from Datalytics
Статья, посвященная не самым распространенным методам Pandas - idxmax(), idxmin(), ne(), nlargest(). В статье приводятся интересные примеры использования этих методов при решении практических задач анализа.
https://habr.com/ru/company/ruvds/blog/479276/
https://habr.com/ru/company/ruvds/blog/479276/
Хабр
Три метода Pandas, о которых вы, возможно, не знали
Автор статьи, перевод которой мы сегодня публикуем, говорит, что когда он узнал о тех методах библиотеки Pandas, о которых хочет тут рассказать, он почувствовал...
Forwarded from Datalytics
Годнота подъехала! Павел Максимов выложил в открытый доступ библиотеку для получения данных из API Яндекс.Метрики (как Logs API, так и из обычного).
https://github.com/pavelmaksimov/tapi-yandex-metrika
https://github.com/pavelmaksimov/tapi-yandex-metrika
Forwarded from Datalytics
Введение в визуализацию данных с помощью Matplotlib. Достаточно подробно объяснены многие нюансы создания визуализаций, например, объектная модель графиков, построение subplots.
https://pythonlearning.org/2019/12/19/introduction-to-data-visualization-using-matplotlib/
https://pythonlearning.org/2019/12/19/introduction-to-data-visualization-using-matplotlib/
Forwarded from Малоизвестное интересное
«Исследуя ИИ, мы подобны собаке, догнавшей машину».
Отрезвляющая оценка будущего ИИ стала итогом 2019.
Все видели, как дурная дворняга преследует машину. Все понимают, чем для нее это может закончиться, если, не бай бог, догонит. Но она-то не понимает, и тупо продолжает.
Вот и мы – исследователи ИИ - «подобны собаке, догнавшей машину» (“We’re kind of like the dog who caught the car”). Не понимаем, что будем делать, если догоним, и не осознаем, к чему это ведет.
Так сказал Блез Агуэра-и-Аркас – один из ключевых людей по машинному обучению в Google, а ранее в Microsoft, – на только что завершившейся крупнейшей конференции года NeurIPS, собравшей более 13 тыс. исследователей и разработчиков ИИ со всего мира.
Это, своего рода, итог 2019.
Его разделил и Йошуа Бенжио - директор института ИИ в Монреале, недавно получивший высшую награду в области вычислительной техники за начало революции глубокого обучения. Он отметил, - «Глубокое обучение дает узкоспециализированные результаты: система, обученная демонстрировать сверхчеловеческую производительность в одной видеоигре, не способна повторить это в никакой другой».
А директор направления ИИ в Facebook Жером Песенти ранее заявил, что его компания, как и другие, не должны ожидать дальнейшего прогресса в области ИИ, просто создавая бОльшие системы глубокого обучения с бОльшей вычислительной мощностью и объемом данных:
«В какой-то момент мы врежемся в стену… И во многих отношениях, - мы уже врезались».
Громкий призыв Бенджио к размышлениям за пределами недавних узких успехов глубокого обучения поддержали и Джефф Клюн из OpenAI, а ранее Uber. Джефф занимается Metalearning - создание алгоритмов обучения, которые могут разработать свои собственные алгоритмы обучения в системах, генерирующих постоянно меняющиеся среды.
«Глубокое обучение - это здорово, но нам нужен набор различных алгоритмов», - добавила Ирина Риш из универа Монреаля. Но проблема в том, что «сторонники глубокого обучения превратились в подобие секты истинно верующих» и просто не желают слышать об альтернативных путях в области ИИ.
«Пытаясь использовать машинное обучения для создания искусственного интеллекта, нам надо больше задумываться о биологических корнях естественного интеллекта», - призвал участников NeurIPS Блез Агуэра-и-Аркас.
Прошедший крупнейший мировой форум по ИИ показал – исследователи ведущих в области ИИ стран и компаний осознают, что уже поздно «что-то в консерватории подправить». Нужны радинальные изменения в направлениях R&D.
Осознают ли это ведущие российские исследователи и разработчики, а также большие боссы, ответственные за развитие ИИ в стране? Боюсь, что нет.
#ИИ
Отрезвляющая оценка будущего ИИ стала итогом 2019.
Все видели, как дурная дворняга преследует машину. Все понимают, чем для нее это может закончиться, если, не бай бог, догонит. Но она-то не понимает, и тупо продолжает.
Вот и мы – исследователи ИИ - «подобны собаке, догнавшей машину» (“We’re kind of like the dog who caught the car”). Не понимаем, что будем делать, если догоним, и не осознаем, к чему это ведет.
Так сказал Блез Агуэра-и-Аркас – один из ключевых людей по машинному обучению в Google, а ранее в Microsoft, – на только что завершившейся крупнейшей конференции года NeurIPS, собравшей более 13 тыс. исследователей и разработчиков ИИ со всего мира.
Это, своего рода, итог 2019.
Его разделил и Йошуа Бенжио - директор института ИИ в Монреале, недавно получивший высшую награду в области вычислительной техники за начало революции глубокого обучения. Он отметил, - «Глубокое обучение дает узкоспециализированные результаты: система, обученная демонстрировать сверхчеловеческую производительность в одной видеоигре, не способна повторить это в никакой другой».
А директор направления ИИ в Facebook Жером Песенти ранее заявил, что его компания, как и другие, не должны ожидать дальнейшего прогресса в области ИИ, просто создавая бОльшие системы глубокого обучения с бОльшей вычислительной мощностью и объемом данных:
«В какой-то момент мы врежемся в стену… И во многих отношениях, - мы уже врезались».
Громкий призыв Бенджио к размышлениям за пределами недавних узких успехов глубокого обучения поддержали и Джефф Клюн из OpenAI, а ранее Uber. Джефф занимается Metalearning - создание алгоритмов обучения, которые могут разработать свои собственные алгоритмы обучения в системах, генерирующих постоянно меняющиеся среды.
«Глубокое обучение - это здорово, но нам нужен набор различных алгоритмов», - добавила Ирина Риш из универа Монреаля. Но проблема в том, что «сторонники глубокого обучения превратились в подобие секты истинно верующих» и просто не желают слышать об альтернативных путях в области ИИ.
«Пытаясь использовать машинное обучения для создания искусственного интеллекта, нам надо больше задумываться о биологических корнях естественного интеллекта», - призвал участников NeurIPS Блез Агуэра-и-Аркас.
Прошедший крупнейший мировой форум по ИИ показал – исследователи ведущих в области ИИ стран и компаний осознают, что уже поздно «что-то в консерватории подправить». Нужны радинальные изменения в направлениях R&D.
Осознают ли это ведущие российские исследователи и разработчики, а также большие боссы, ответственные за развитие ИИ в стране? Боюсь, что нет.
#ИИ
Forwarded from Библиотека питониста | Python, Django, Flask
YouTube
Matplotlib Tutorial (Part 1): Creating and Customizing Our First Plots
In this video, we will be learning how to get started with Matplotlib.
This video is sponsored by Brilliant. Go to https://brilliant.org/cms to sign up for free. Be one of the first 200 people to sign up with this link and get 20% off your premium subnoscription.…
This video is sponsored by Brilliant. Go to https://brilliant.org/cms to sign up for free. Be one of the first 200 people to sign up with this link and get 20% off your premium subnoscription.…
Forwarded from TechSparks
Легко писать подводки к новостям — куда сложнее к серьезным сложным лонгридам, смысл чтения которых отнюдь не в том, чтобы вычленить одну главную мысль. Но на этот текст я всё равно сошлюсь, хотя читать его надо медленно и вдумчиво.
Длинное интервью со Львом Мановичем начинается с подробного рассказа о его биографии и творчестве, и это правильно: у него нетривиальная судьба художника и профессора computer science, огромный авторитет в двух этих мирах - и современного искусства, и современных технологий.
Его взгляды иногда бесят традиционный истэблишмент, но он умеет прекрасно обосновывать свою точку зрения, которая часто отличается от принятой в тусовке интеллектуалов. Он не видит большой проблемы в fake news — но видит ее в самой журналистике; он не готов критиковать Википедию за то, что ее редакторы недостаточно diverse и ещё он любит Москву ;) Кстати, он приезжал на Открытые Инновации в Сколково, и очень жаль, что там мало народу его слушали.
Ну хоть сейчас почитайте — его мысли полезно знать, даже если не согласны с ними.
https://www.haaretz.com/magazine/.premium.MAGAZINE-fake-news-isn-t-the-issue-leading-internet-researcher-debunks-what-we-know-1.8291672
Длинное интервью со Львом Мановичем начинается с подробного рассказа о его биографии и творчестве, и это правильно: у него нетривиальная судьба художника и профессора computer science, огромный авторитет в двух этих мирах - и современного искусства, и современных технологий.
Его взгляды иногда бесят традиционный истэблишмент, но он умеет прекрасно обосновывать свою точку зрения, которая часто отличается от принятой в тусовке интеллектуалов. Он не видит большой проблемы в fake news — но видит ее в самой журналистике; он не готов критиковать Википедию за то, что ее редакторы недостаточно diverse и ещё он любит Москву ;) Кстати, он приезжал на Открытые Инновации в Сколково, и очень жаль, что там мало народу его слушали.
Ну хоть сейчас почитайте — его мысли полезно знать, даже если не согласны с ними.
https://www.haaretz.com/magazine/.premium.MAGAZINE-fake-news-isn-t-the-issue-leading-internet-researcher-debunks-what-we-know-1.8291672
Forwarded from Datalytics
Уже выкладывал в канале ссылку на код инструмента для анализа цепей Маркова, но появилась хорошая обзорная статья по мотивам доклада Mark Sysoev на Матемаркетинге. Ссылка на Гитхаб внутри статьи
https://vc.ru/skyeng/92219-besplatnyy-python-skript-kotoryy-pomozhet-vam-uluchshit-analiz-voronok-cjm-i-dazhe-poisk-bagov-v-produkte
https://vc.ru/skyeng/92219-besplatnyy-python-skript-kotoryy-pomozhet-vam-uluchshit-analiz-voronok-cjm-i-dazhe-poisk-bagov-v-produkte
vc.ru
Бесплатный Python-скрипт, который поможет вам улучшить анализ воронок, CJM и даже поиск багов в продукте — Skyeng на vc.ru
Обычно вы используете кучу дорогих тяжелых приложений с закрытым кодом, чтобы анализировать путь клиента и интерпретировать данные о его поведении. Наш коллега Марк Сысоев создал свой простой инструмент для тех же задач и выложил на Github в виде небольшого…
Forwarded from Datalytics
Тем кто работает в ecommerce точно пригодится. Статья о том как подготовить товарные cross-sell рекомендации с помощью pandas и алгоритма ассоциативных правил из библиотеки MLextend.
https://pythondata.com/market-basket-analysis-with-python-and-pandas/
https://pythondata.com/market-basket-analysis-with-python-and-pandas/
Python Data
Market Basket Analysis with Python and Pandas - Python Data
Market basket analysis looks at retail sales data and determines what products are purchased together. In this article, I provide an approach using python to perform this analysis.
Forwarded from Beards Analytics
Симо Ахава сделал новый custom template tag, который отдает гео данные, что весьма приятно
https://www.simoahava.com/analytics/fetch-ip-geolocation-data-using-google-tag-manager/
https://www.simoahava.com/analytics/fetch-ip-geolocation-data-using-google-tag-manager/
Simo Ahava's blog
Fetch IP Geolocation Data Using Google Tag Manager
Use the IP Geolocation API and a Google Tag Manager custom tag template to fetch IP address and geolocation data for the user.
Гайд для погружения в машинное обучение: https://foobar167.github.io/page/vvedeniye-v-mashinnoye-obucheniye-i-iskusstvennyye-neyronnyye-seti.html
Forwarded from Комнатная аналитика
3 способа отследить источники трафика для мобильных приложений
Одной из наиболее сложных задач при настройке мобильной аналитики является отслеживание источников трафика. Здесь вам не помогут привычные UTM-метки, так как приложение скачивается пользователем из специализированного магазина, например AppStore или Google Play.
В новой статье делимся 3 способами настройки отслеживания источников трафика, которые зачастую требуют от аналитика нестандартного мышления и креативности.
via @analyticsroom
Одной из наиболее сложных задач при настройке мобильной аналитики является отслеживание источников трафика. Здесь вам не помогут привычные UTM-метки, так как приложение скачивается пользователем из специализированного магазина, например AppStore или Google Play.
В новой статье делимся 3 способами настройки отслеживания источников трафика, которые зачастую требуют от аналитика нестандартного мышления и креативности.
via @analyticsroom
Teletype
3 способа отследить источники трафика для мобильных приложений
Внедрение событий в мобильных приложениях, их настройка и проверка зачастую не вызывают сложностей. Проблемы возникают, когда дело...
Forwarded from Datalytics
Статья с интересным примером прикладного анализа данных. Автор Олег Юрьев исследует характеристики, рейтинг и стоимость светодиодных ламп, сопровождая всё подробными комментариями.
http://rweather.ru/blog/all/veselaya-analitika-lamptest/
http://rweather.ru/blog/all/veselaya-analitika-lamptest/
Forwarded from Datalytics
Статья о том как важно для аналитика данных автоматизировать свои рутинные задачи, писать функции, которые будут использоваться из проекта в проект. В статье есть несколько примеров таких функций, например, для объединения csv-файлов или переименования колонок датафреймов.
https://towardsdatascience.com/automate-boring-tasks-with-your-own-functions-a32785437179
https://towardsdatascience.com/automate-boring-tasks-with-your-own-functions-a32785437179
Medium
7 Simple Python Functions to Clean Your Data
Automating tasks with Python is easy. Once you have a noscript that works, turn it into a function that will help you code more efficiently!
Forwarded from Маркетинг-аналитика с OWOX BI
Зачем ограничивать себя в точности отчетов, если можно воспользоваться Google BigQuery?
Инструкция, которая поможет вам выгрузить сырые данные из Google Ads в Google BigQuery для более качественной оценки эффективности рекламы.
Инструкция, которая поможет вам выгрузить сырые данные из Google Ads в Google BigQuery для более качественной оценки эффективности рекламы.
Forwarded from Digital Puzzle (Olena_Fedorovska)
Сегодня техническо-аналитическая подборка.
🔹 Гайд по GTM в трех частях:
1️⃣ Что это, кому нужно и как начать работу.
https://pengstud.com/blog/gtm-1/
2️⃣ Создание и настройка тегов на примере Google Analytics.
https://pengstud.com/blog/gtm-2/
3️⃣ Миграция установленных напрямую на сайт тегов в GTM.
https://pengstud.com/blog/gtm-3/
Думаю, что будет продолжение. Следите за выпусками.
🔹 Подборка обучающих материалов для начинающего аналитика:
https://netpeak.net/ru/blog/podborka-obuchayushchikh-materialov-dlya-nachinayushchego-analitika/
#Analytics
🔹 Гайд по GTM в трех частях:
1️⃣ Что это, кому нужно и как начать работу.
https://pengstud.com/blog/gtm-1/
2️⃣ Создание и настройка тегов на примере Google Analytics.
https://pengstud.com/blog/gtm-2/
3️⃣ Миграция установленных напрямую на сайт тегов в GTM.
https://pengstud.com/blog/gtm-3/
Думаю, что будет продолжение. Следите за выпусками.
🔹 Подборка обучающих материалов для начинающего аналитика:
https://netpeak.net/ru/blog/podborka-obuchayushchikh-materialov-dlya-nachinayushchego-analitika/
#Analytics
Forwarded from BigQuery Insights
Полезный пример SQL-запроса, позволяющий распарсить и транспонировать данные json-образной структуры из строк в колонки.
via @BigQuery
via @BigQuery
Forwarded from Product Analytics
Как повысить продуктивность при анализе данных? 25 неочевидных инструментов
https://proglib.io/p/kak-povysit-produktivnost-pri-analize-dannyh-25-neochevidnyh-instrumentov-2020-01-16
via @ProductAnalytics
https://proglib.io/p/kak-povysit-produktivnost-pri-analize-dannyh-25-neochevidnyh-instrumentov-2020-01-16
via @ProductAnalytics
Библиотека программиста
Как повысить продуктивность при анализе данных? 25 неочевидных инструментов
Список бесплатных инструментов и библиотек для аналитиков данных. Заслуживающие внимания пакеты, программы и ресурсы, о которых не так часто упоминают, как о NumPy, Pandas или Jupyter.