NEW BOT Телеграм, страница

Вот еще куча полезных ссылок и постов по Data Science.
#DataScience

248 viewsIrina, 06:13

Меню канала с основными постами.

Основы Data Science, алгоритмы.
1. Data Science
2. Big Data
3. Data Mining
4. Нейросети
5. Задача про Титаник
6. Регрессия, регрессоры. Классификаторы.
7. Деревья решений
8. Наивный Байесовский классификатор
9. Метод K-ближайших соседей

Визуализация.
1. Визуализация данных
2. Тепловые карты

Истории о нейросетях
1. Пример работы нейросети на примере боев сумо
2. Нейросети и распознавание порноактеров
3. Нейросети и трейдинг
4. Нейросети и видеослежка

Истории из жизни.
1. Айфон-психолог
2. Магазины вычисляют вашу беременность
3. Знакомство с помощью Data Science
4. Знакомство с помощью Data Science - 2
5. Про машинный перевод

10 viewsIrina, 06:13

Data Place

Бесплатный гайд для новичков по машинному обучению

http://www.allitebooks.in/machine-learning-dummies/

300 viewsIrina, 16:54

Data Place

Forwarded from Python Textbooks (Mariya Goroshko)

Natural Language Processing with Python – S. Bird, E. Klein, E. Loper (en) 2009

Рассказывается о различных языковых технологиях: от фильтрации электронной почты до автоматического перевода.

#middle

9 viewsIrina, 15:10

Data Place

Forwarded from Data Science Notes (Mariya Goroshko)

Python Machine Learning – Sebastian Raschka (en)

Даст более глубокое понимание машинного обучения.

#book #middle #theory

10 viewsIrina, 15:25

Data Place

https://mindfulmachines.io/blog/2018/6/apache-spark-scala-vs-java-v-python-vs-r-vs-sql26

mindful machines

Apache Spark: Scala vs. Java v. Python vs. R vs. SQL — mindful machines

One of Apache Spark’s selling points is the cross-language API that allows you to write Spark code in Scala, Java, Python, R or SQL (with others supported unofficially). However not all language APIs are created equal and in this post we'll look at the differences…

320 viewsIrina, 22:47

Data Place

Глубокое обучение при помощи Spark и Hadoop: знакомство с #Deeplearning4j:
https://habr.com/company/piter/blog/344824/

Habr

Глубокое обучение при помощи Spark и Hadoop: знакомство с Deeplearning4j

Здравствуйте, уважаемые читатели! Мы вполне убедились в мегапопулярности глубокого обучения (Deep Learning) на языке Python в нашей целевой аудитории. Теперь...

366 viewsIrina, 08:27

Data Place

Радиология Москвы: Репозиторий открытых данных для машинного обучения и «искусственного интеллекта»

http://medradiology.moscow/iskusstvennyy-intellekt

#CT #Radiology #OpenData

373 viewsIrina, edited 22:44

Data Place

https://blog.piekniewski.info/2018/07/14/autopsy-dl-paper/

Piekniewski's blog

Autopsy of a deep learning paper

Introduction I read a lot of deep learning papers, typically a few/week. I've read probably several thousands of papers. My general problem with papers in machine learning or deep learning is that often they sit

353 viewsIrina, 21:51

Data Place

Правда и ложь систем распознавания лиц
https://m.habr.com/company/recognitor/blog/418127/

Habr

Правда и ложь систем распознавания лиц

Пожалуй нет ни одной другой технологии сегодня, вокруг которой было бы столько мифов, лжи и некомпетентности. Врут журналисты, рассказывающие о технологии, врут...

383 viewsIrina, edited 09:04

Data Place

Ongoing Face Recognition Vendor Test (FRVT) Part 1: Verification

#NIST #FaceRecognitionTest
https://www.nist.gov/sites/default/files/documents/2018/06/21/frvt_report_2018_06_21.pdf

393 viewsIrina, 10:23

Data Place

First Class GPUs support in Apache Hadoop 3.1, YARN & HDP 3.0
https://hortonworks.com/blog/gpus-support-in-apache-hadoop-3-1-yarn-hdp-3/

Hortonworks

First Class GPUs support in Apache Hadoop 3.1, YARN & HDP 3.0 - Hortonworks

GPUs are increasingly becoming a key tool for many big data applications that use Apache . Hadoop and YARN.

379 viewsIrina, 16:33

Data Place

Простенько, но зато понятно. О том, чем Docker может быть полезен дата-ученому.
https://www.kdnuggets.com/2018/08/data-scientist-guide-getting-started-docker.html
#Docker

363 viewsIrina, 20:34

Data Place

Forwarded from ЗаТелеком 🌐

Аксакалы рунета. Историческая фоточка, между прочим.

13 viewsIrina, 11:10

Data Place

Случайно затесалась к аксакалам Рунета, тк была в роли со-организатора.

373 viewsIrina, 11:11

Data Place

Alberto Cairo выложил в открытый доступ видеоматериалы своих тренингов по визуализации данных: http://www.thefunctionalart.com/2018/08/visualization-mooc-materials-available.html?m=1

358 viewsIrina, 00:04

Data Place

Forwarded from Machinelearning

What are the experts in data analysis really doing? Conclusions from 35 interviews https://habr.com/company/wirex/blog/421845/

Хабр

Чем на самом деле занимаются специалисты по анализу данных? Выводы из 35 интервью

Автор материала провел серию бесед с экспертами в области анализа и обработки данных и сделал выводы о перспективах и направлениях развития дата-сайентистов. Т...

13 viewsIrina, 14:11

Data Place

Forwarded from Ivan Begtin (Ivan Begtin)

Оказывается Гугл открыли поиск по датасетам (Google Dataset Search) [1] пока в бета версии, но уже работает.
Его поиск основан на тегах dataset [2] с помощью которых описываются структурированные данные.

Плюс в том что это позволяет Гуглу индексировать все данные описанные таким образом через атрибуты typeof="dcat:Dataset" или в коде <noscript type="application/ld+json">. В инструкциях есть примеры [4] того как это делается.

Минус в том что данные очень сконцентрированы в порталах у которых большинства есть стандартизованное API, в основном, API продукта CKAN. Например, только в Res3Data [5] более 2000 каталогов. Большая их часть не использует тэги гугла для индексирования и живут со своим правилам.

В принципе создавая поиск по датасетам важно помнить о том что есть 3 условных категории пользователей:
- общественно-политические
- коммерческие
- научные / академические

Можно их свести к общему знаменателю, но всё же с учётом их потребностей. И, на мой взгляд, важнее уметь индексировать цифровые репозитории через существующие API, чем навязывать публикацию тегом dataset. Во всяком случае краткосрочно, а долгосрочно конечно всё делается правильно.

Ссылки:
[1] https://toolbox.google.com/datasetsearch
[2] https://developers.google.com/search/docs/data-types/dataset
[3] https://search.google.com/structured-data/testing-tool
[4] https://productforums.google.com/forum/#!topic/webmasters/nPq4BW6iPIA
[5] https://www.re3data.org/

#opendata #google

Google for Developers

Dataset Structured Data | Google Search Central | Documentation | Google for Developers

Learn how to add schema.org Dataset structured data. Implementing this can help Google recognize the dataset creator, distribution format, and other information.

15 viewsIrina, 08:45

Data Place

Forwarded from Ivan Begtin (Ivan Begtin)

Инструменты, истории и сервисы на данных:
- Поиск автора статьи в NYTimes [1] об инсайдере в администрации Трампа через анализ статьи и твитов сотрудников администрации [2]
- Deon. Инструмент проверки на дата этику для дата сайентистов [3]. Полезен всем без исключения для самопроверки. На русский пока не переведён
- Why data culture matters ? [4] Статья в журнале McKinsey о важности культуры работы с данными в организации

Ссылки:
[1] https://www.nytimes.com/2018/09/05/opinion/trump-white-house-anonymous-resistance.html
[2] http://varianceexplained.org/r/op-ed-text-analysis/
[3] http://deon.drivendata.org
[4] https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/why-data-culture-matters

#data

NY Times

Opinion | I Am Part of the Resistance Inside the Trump Administration (Published 2018)

I work for the president but like-minded colleagues and I have vowed to thwart parts of his agenda and his worst inclinations.

12 viewsIrina, 08:46

Data Place

Forwarded from IoTing: новости&мысли

Если вы интересуетесь IoT или даже работаете в этой области, то всегда полезно иметь под рукой каталог компаний. Это могут быть или потенциальные партнеры и коллеги, или конкуренты. Знать о том, и о том — полезно.

И вот, например, есть такая гуглокарта Map of IoT Companies & Startups

https://www.google.com/maps/d/viewer?mid=1HvovjRP_nq0ny-f-yDbz9RdIhUBBX0KA

Но там отстутсвуют российские проекты.

Потому, напомню за проект, где мы собираем (ну, стараемся собрать) данные обо всех российский хардверных проектах и компаниях.

На сегодня в таблице 49 записей из которых 10 стартапов.

Все данныепубликуются вот тут:
http://bit.ly/CATALOG_RUSHARDWARE

А чтоб попасть в «каталог», нужно всего лишь заполнить гуглоформу:
http://bit.ly/RUS_HARDWARE

Google My Maps

Map of IoT Companies & Startups - Google My Maps

13 viewsIrina, 12:18

Data Place

The purpose of this roadmap is to give you an overview of the core skills needed in data science. These are views help by individuals we have spoken to and do not represent any companies’ opinion.

https://github.com/hasbrain/data-science-roadmap

GitHub

GitHub - boringPpl/data-science-roadmap: Learning from multiple companies in Silicon Valley. Netflix, Facebook, Google, Startups

Learning from multiple companies in Silicon Valley. Netflix, Facebook, Google, Startups - boringPpl/data-science-roadmap

430 viewsIrina, 12:46

About

Blog

Apps

Platform