Data Science mind maps: http://cedadocs.ceda.ac.uk/962/2/Data-Scientist_Poster.pdf
Forwarded from Data Science Notes (Mariya Goroshko)
Список платформ с наборами данных и API: https://www.kdnuggets.com/datasets/api-hub-marketplace-platform.html
KDnuggets
Data: APIs, Hubs, Marketplaces, and Platforms - KDnuggets
See also Government, Federal, State, City, Local and public data sites and portals Data APIs, Hubs, Marketplaces, Platforms, and Search Engines AggData, aggregate data in 15+ categories, with a focus on location data, like Starbucks locations. Apertio, lets…
Data Science Predicting The Future:
https://www.kdnuggets.com/2018/06/data-science-predicting-future.html
https://www.kdnuggets.com/2018/06/data-science-predicting-future.html
Data Lake – the evolution of data processing:
https://www.kdnuggets.com/2018/06/data-lake-evolution-data-processing.html
https://www.kdnuggets.com/2018/06/data-lake-evolution-data-processing.html
Плюс книга "Learning Pandas": https://github.com/Gewissta/Learning_Pandas_russian_translation
#Pandas #Python
#Pandas #Python
Forwarded from DevBrain
Вышел долгожданный Python 3.7.0.
Из новинок:
- встроенная функция breakpoint
- Data Classes
- словари теперь хранят порядок при добавлении ключей (прощай, OrderedDict)
и т.д. Более подробный список изменений можно посмотреть по ссылке — https://www.python.org/downloads/release/python-370/
Из новинок:
- встроенная функция breakpoint
- Data Classes
- словари теперь хранят порядок при добавлении ключей (прощай, OrderedDict)
и т.д. Более подробный список изменений можно посмотреть по ссылке — https://www.python.org/downloads/release/python-370/
Python.org
Python Release Python 3.7.0
The official home of the Python Programming Language
Вот здесь можно бесплатно скачать книгу Practical Data Analysis:
https://www.packtpub.com/packt/free-ebook/practical-data
https://www.packtpub.com/packt/free-ebook/practical-data
Packtpub
Your Free Data Analysis eBook | PACKT Books
Packt Publishing provides technology eBooks, books and videos to help IT Developers and Administrators to put software and tools to work in new ways.
Apache Spark Under the Hood. Getting started with core architecture and basic concepts: https://pages.databricks.com/rs/094-YMS-629/images/Mini%20eBook%20-%20Apache%20Spark%20v2.pdf
#ApacheSpark
#ApacheSpark
Forwarded from Python Textbooks (Mariya Goroshko)
Bioinformatics Programming Using Python – Mitchell L Model (en) 2010
Покажет как использовать Python для автоматизации задач в научных исследованиях.
#middle
Покажет как использовать Python для автоматизации задач в научных исследованиях.
#middle
Forwarded from Python Textbooks (Igor A. Kamyshev)
Machine Learning an Algorithmic Perspective – Stephen Marsland (en) 2015
Рассказывает о алгоритмах, используемых при машинном обучении.
#middle
Рассказывает о алгоритмах, используемых при машинном обучении.
#middle
The scikit-learn Random Forest feature importance and R's default Random Forest feature importance strategies are biased. To get reliable results in Python, use permutation importance, provided here and in our rfpimp package (via pip). For R, use importance=T in the Random Forest constructor then type=1 in R's importance() function. In addition, your feature importance measures will only be reliable if your model is trained with suitable hyper-parameters.
http://explained.ai/rf-importance/index.html
http://explained.ai/rf-importance/index.html
explained.ai
Beware Default Random Forest Importances
Training a model that accurately predicts outcomes is great, but most of the time you don't just need predictions, you want to be able to interpret your model. The problem is that the scikit-learn Random Forest feature importance and R's default Random Forest…
Обнаружила книгу "The UNIX
Programming Environment" авторства Mark Burgess [http://pdplab.it.uom.gr/project/sysadm/unix.pdf], хотя, понятное дело, искала классику [http://cs2.ist.unomaha.edu/~stanw/163/csci4500/UNIXProgrammingEnvironment.pdf] Brian W. Kernighan.
Ну и кто так свои книги называет?!
Programming Environment" авторства Mark Burgess [http://pdplab.it.uom.gr/project/sysadm/unix.pdf], хотя, понятное дело, искала классику [http://cs2.ist.unomaha.edu/~stanw/163/csci4500/UNIXProgrammingEnvironment.pdf] Brian W. Kernighan.
Ну и кто так свои книги называет?!
Forwarded from Data Science Notes (Igor A. Kamyshev)
Forwarded from Data Science и все такое
Меню канала с основными постами.
Основы Data Science, алгоритмы.
1. Data Science
2. Big Data
3. Data Mining
4. Нейросети
5. Задача про Титаник
6. Регрессия, регрессоры. Классификаторы.
7. Деревья решений
8. Наивный Байесовский классификатор
9. Метод K-ближайших соседей
Визуализация.
1. Визуализация данных
2. Тепловые карты
Истории о нейросетях
1. Пример работы нейросети на примере боев сумо
2. Нейросети и распознавание порноактеров
3. Нейросети и трейдинг
4. Нейросети и видеослежка
Истории из жизни.
1. Айфон-психолог
2. Магазины вычисляют вашу беременность
3. Знакомство с помощью Data Science
4. Знакомство с помощью Data Science - 2
5. Про машинный перевод
Основы Data Science, алгоритмы.
1. Data Science
2. Big Data
3. Data Mining
4. Нейросети
5. Задача про Титаник
6. Регрессия, регрессоры. Классификаторы.
7. Деревья решений
8. Наивный Байесовский классификатор
9. Метод K-ближайших соседей
Визуализация.
1. Визуализация данных
2. Тепловые карты
Истории о нейросетях
1. Пример работы нейросети на примере боев сумо
2. Нейросети и распознавание порноактеров
3. Нейросети и трейдинг
4. Нейросети и видеослежка
Истории из жизни.
1. Айфон-психолог
2. Магазины вычисляют вашу беременность
3. Знакомство с помощью Data Science
4. Знакомство с помощью Data Science - 2
5. Про машинный перевод