Data Place – Telegram
Data Place
550 subscribers
34 photos
2 files
212 links
Канал про данные, науку о данных и про обучение работе с данными.
Автор: Ирина Радченко, доцент, канд. техн. наук, любитель данных и Computer Science, в Телеграме -- @dadaistka
Download Telegram
Forwarded from Data Science Notes (Igor A. Kamyshev)
TensorFlow Machine Learning Cookbook — Nick McClure (en) 2017

Поможет изучить концепции машинного обучения, используя новейшие
библиотеки, такие как TensorFlow.

#book #middle #python
Вот еще куча полезных ссылок и постов по Data Science.
#DataScience
Бесплатный гайд для новичков по машинному обучению

http://www.allitebooks.in/machine-learning-dummies/
Forwarded from Python Textbooks (Mariya Goroshko)
Natural Language Processing with Python – S. Bird, E. Klein, E. Loper (en) 2009

Рассказывается о различных языковых технологиях: от фильтрации электронной почты до автоматического перевода.

#middle
Forwarded from Data Science Notes (Mariya Goroshko)
Python Machine Learning – Sebastian Raschka (en)

Даст более глубокое понимание машинного обучения.

#book #middle #theory
Радиология Москвы: Репозиторий открытых данных для машинного обучения и «искусственного интеллекта»

http://medradiology.moscow/iskusstvennyy-intellekt

#CT #Radiology #OpenData
Простенько, но зато понятно. О том, чем Docker может быть полезен дата-ученому.
https://www.kdnuggets.com/2018/08/data-scientist-guide-getting-started-docker.html
#Docker
Forwarded from ЗаТелеком 🌐
Аксакалы рунета. Историческая фоточка, между прочим.
Случайно затесалась к аксакалам Рунета, тк была в роли со-организатора.
Alberto Cairo выложил в открытый доступ видеоматериалы своих тренингов по визуализации данных: http://www.thefunctionalart.com/2018/08/visualization-mooc-materials-available.html?m=1
Forwarded from Ivan Begtin (Ivan Begtin)
Оказывается Гугл открыли поиск по датасетам (Google Dataset Search) [1] пока в бета версии, но уже работает.
Его поиск основан на тегах dataset [2] с помощью которых описываются структурированные данные.

Плюс в том что это позволяет Гуглу индексировать все данные описанные таким образом через атрибуты typeof="dcat:Dataset" или в коде <noscript type="application/ld+json">. В инструкциях есть примеры [4] того как это делается.

Минус в том что данные очень сконцентрированы в порталах у которых большинства есть стандартизованное API, в основном, API продукта CKAN. Например, только в Res3Data [5] более 2000 каталогов. Большая их часть не использует тэги гугла для индексирования и живут со своим правилам.

В принципе создавая поиск по датасетам важно помнить о том что есть 3 условных категории пользователей:
- общественно-политические
- коммерческие
- научные / академические

Можно их свести к общему знаменателю, но всё же с учётом их потребностей. И, на мой взгляд, важнее уметь индексировать цифровые репозитории через существующие API, чем навязывать публикацию тегом dataset. Во всяком случае краткосрочно, а долгосрочно конечно всё делается правильно.


Ссылки:
[1] https://toolbox.google.com/datasetsearch
[2] https://developers.google.com/search/docs/data-types/dataset
[3] https://search.google.com/structured-data/testing-tool
[4] https://productforums.google.com/forum/#!topic/webmasters/nPq4BW6iPIA
[5] https://www.re3data.org/

#opendata #google
Forwarded from Ivan Begtin (Ivan Begtin)
Инструменты, истории и сервисы на данных:
- Поиск автора статьи в NYTimes [1] об инсайдере в администрации Трампа через анализ статьи и твитов сотрудников администрации [2]
- Deon. Инструмент проверки на дата этику для дата сайентистов [3]. Полезен всем без исключения для самопроверки. На русский пока не переведён
- Why data culture matters ? [4] Статья в журнале McKinsey о важности культуры работы с данными в организации

Ссылки:
[1] https://www.nytimes.com/2018/09/05/opinion/trump-white-house-anonymous-resistance.html
[2] http://varianceexplained.org/r/op-ed-text-analysis/
[3] http://deon.drivendata.org
[4] https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/why-data-culture-matters

#data
Если вы интересуетесь IoT или даже работаете в этой области, то всегда полезно иметь под рукой каталог компаний. Это могут быть или потенциальные партнеры и коллеги, или конкуренты. Знать о том, и о том — полезно.

И вот, например, есть такая гуглокарта Map of IoT Companies & Startups

https://www.google.com/maps/d/viewer?mid=1HvovjRP_nq0ny-f-yDbz9RdIhUBBX0KA

Но там отстутсвуют российские проекты.

Потому, напомню за проект, где мы собираем (ну, стараемся собрать) данные обо всех российский хардверных проектах и компаниях.

На сегодня в таблице 49 записей из которых 10 стартапов.

Все данныепубликуются вот тут:
http://bit.ly/CATALOG_RUSHARDWARE

А чтоб попасть в «каталог», нужно всего лишь заполнить гуглоформу:
http://bit.ly/RUS_HARDWARE