Forwarded from EarthML
Pandas for Geospatial data:
🐼Working with coordinates can be a nightmare and GeoPandas tool comes quite handy.
The goal of GeoPandas is to make working with geospatial data in python easier. It combines the capabilities of pandas and shapely, providing geospatial operations in pandas and a high-level interface to multiple geometries to shapely. GeoPandas enables you to easily do operations in python that would otherwise require a spatial database such as PostGIS.
🌎 Learn more here: http://geopandas.org/
Stay tuned, subscribe and share!
xoxo
🐼Working with coordinates can be a nightmare and GeoPandas tool comes quite handy.
The goal of GeoPandas is to make working with geospatial data in python easier. It combines the capabilities of pandas and shapely, providing geospatial operations in pandas and a high-level interface to multiple geometries to shapely. GeoPandas enables you to easily do operations in python that would otherwise require a spatial database such as PostGIS.
🌎 Learn more here: http://geopandas.org/
Stay tuned, subscribe and share!
xoxo
THE DATA SCIENCE INTERVIEW STUDY GUIDE
https://www.coriers.com/the-data-science-interview-study-guide/
https://www.coriers.com/the-data-science-interview-study-guide/
Coriers
The Data Science Interview Study Guide - Coriers
By Ben Rogojan Data science technical interviews, like other technical interviews require plenty of preparation. There are lots of subjects that need to be covered in order to ensure you are ready for a data science interview. Before we get started. We want…
AWS launches Textract, machine learning for text and data extraction
https://venturebeat.com/2019/05/29/aws-launches-textract-machine-learning-for-text-and-data-extraction/amp/
https://venturebeat.com/2019/05/29/aws-launches-textract-machine-learning-for-text-and-data-extraction/amp/
VentureBeat
AWS launches Textract, machine learning for text and data extraction
AWS' Textract, which leverages machine learning algorithms to detect and extract text and data from a range of document types, is now generally available.
Meta-Learners - learning how to learn
https://blog.fastforwardlabs.com/2019/05/22/metalearners-learning-how-to-learn.html
https://blog.fastforwardlabs.com/2019/05/22/metalearners-learning-how-to-learn.html
Fastforwardlabs
Meta-Learners - learning how to learn
Active learning allows us to be smart about picking the right set of datapoints for which to create labels. Done properly, this approach results in models that are trained on less data performing comparatively to models trained on much more data. In the world…
Awesome Knowledge Graph Embedding Approaches
This list contains repositories of libraries and approaches for knowledge graph embeddings, which are vector representations of entities and relations in a multi-relational directed labelled graph.
https://gist.github.com/mommi84/07f7c044fa18aaaa7b5133230207d8d4
This list contains repositories of libraries and approaches for knowledge graph embeddings, which are vector representations of entities and relations in a multi-relational directed labelled graph.
https://gist.github.com/mommi84/07f7c044fa18aaaa7b5133230207d8d4
Gist
Awesome Knowledge Graph Embedding Approaches
Awesome Knowledge Graph Embedding Approaches. GitHub Gist: instantly share code, notes, and snippets.
Data Science Blogs
A curated list of 200+ blogs related to Data Science.
https://www.cybrhome.com/topic/data-science-blogs?q=data%20science
A curated list of 200+ blogs related to Data Science.
https://www.cybrhome.com/topic/data-science-blogs?q=data%20science
CybrHome
Ultimate List of 200+ Must-Know Data Science Blogs
A curated list of 200+ blogs related to Data Science. Explore the best of data science using these top data science blogs.
ARIMA Model – Complete Guide to Time Series Forecasting in Python
https://www.machinelearningplus.com/time-series/arima-model-time-series-forecasting-python
https://www.machinelearningplus.com/time-series/arima-model-time-series-forecasting-python
Machine Learning Plus
ARIMA Model – Complete Guide to Time Series Forecasting in Python
Learn Data Science (AI/ML/Gen AI) Online
На DataCamp появился курс Data Science for Managers: https://www.datacamp.com/courses/data-science-for-managers
What Your Employees Need to Learn to Work With Data in the 21st Century
https://www.datacamp.com/community/blog/what-your-employees-need-to-learn-to-work-with-data-in-the-21st-century
Slides: https://docs.google.com/presentation/d/14W_KDsI8ei6sQVS1ab4qnBUGZ_qAtdJoySxTtX7Tq98/edit?usp=sharing
https://www.datacamp.com/community/blog/what-your-employees-need-to-learn-to-work-with-data-in-the-21st-century
Slides: https://docs.google.com/presentation/d/14W_KDsI8ei6sQVS1ab4qnBUGZ_qAtdJoySxTtX7Tq98/edit?usp=sharing
DataCamp Community
What Your Employees Need to Learn to Work With Data in the 21st Century
Hugo Bowne-Anderson, data scientist and host of our podcast DataFramed, deconstructs the essential topics and skills that employees need to know to work with data.
Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто интересуется данными не только с точки зрения Data Science, но и в более прикладных задачах работы с данными относящимися к дата инженерии.
Несколько полезных ресурсов:
- Data Engineering Cookbook [1] - поваренная книга по инженерии данных, много о том как системы работы с данными разворачиваются и используются
- Awesome Data Engineering - неплохой список ссылок на проекты по инженерии данных на Github
- Data Engineering How-to [3] - подборка ссылок на курсы и иные ресурсы по инжинерии данных
- What is Data Engineer [4] - ответ на вопрос кто такой инженер данных (для тех кто ещё об этом не знает)
- Who Is a Data Engineer & How to Become a Data Engineer? - подробно о том кто такие инженеры данных
В России вот уже много лет ажиотажный спрос на data science, но подготовка дата инженеров ушла на 2-й и 3-й план и это особенно чувствуется когда вопросы о том где взять данные и как настроить инфраструктуру звучат всё чаще.
То чем занимаюсь я лично - это чистая дата инженерия, с очень и очень небольшой долей науки о данных. Найти данные, создать инфраструктуру их обработки и очистки - всё это должен уметь дата инженер. Если Вы знаете хорошие курсы по этой теме на русском языке, поделитесь ими, например в чате.
Ссылки:
[1] https://github.com/andkret/Cookbook
[2] https://github.com/igorbarinov/awesome-data-engineering
[3] https://github.com/adilkhash/Data-Engineering-HowTo
[4] https://towardsdatascience.com/who-is-a-data-engineer-how-to-become-a-data-engineer-1167ddc12811
#data #opendata #dataengineering #dataengineer
Несколько полезных ресурсов:
- Data Engineering Cookbook [1] - поваренная книга по инженерии данных, много о том как системы работы с данными разворачиваются и используются
- Awesome Data Engineering - неплохой список ссылок на проекты по инженерии данных на Github
- Data Engineering How-to [3] - подборка ссылок на курсы и иные ресурсы по инжинерии данных
- What is Data Engineer [4] - ответ на вопрос кто такой инженер данных (для тех кто ещё об этом не знает)
- Who Is a Data Engineer & How to Become a Data Engineer? - подробно о том кто такие инженеры данных
В России вот уже много лет ажиотажный спрос на data science, но подготовка дата инженеров ушла на 2-й и 3-й план и это особенно чувствуется когда вопросы о том где взять данные и как настроить инфраструктуру звучат всё чаще.
То чем занимаюсь я лично - это чистая дата инженерия, с очень и очень небольшой долей науки о данных. Найти данные, создать инфраструктуру их обработки и очистки - всё это должен уметь дата инженер. Если Вы знаете хорошие курсы по этой теме на русском языке, поделитесь ими, например в чате.
Ссылки:
[1] https://github.com/andkret/Cookbook
[2] https://github.com/igorbarinov/awesome-data-engineering
[3] https://github.com/adilkhash/Data-Engineering-HowTo
[4] https://towardsdatascience.com/who-is-a-data-engineer-how-to-become-a-data-engineer-1167ddc12811
#data #opendata #dataengineering #dataengineer
GitHub
GitHub - andkret/Cookbook: The Data Engineering Cookbook
The Data Engineering Cookbook. Contribute to andkret/Cookbook development by creating an account on GitHub.
The AI research field clusters around seven main research areas.
https://www.elsevier.com/connect/using-ai-to-map-ai
https://www.elsevier.com/connect/using-ai-to-map-ai
Elsevier Connect
Using AI to map … AI?
Elsevier’s new report sheds light on the future of global artificial intelligence research
Machine Learning and Data Science Applications in Industry
https://github.com/firmai/industry-machine-learning
https://github.com/firmai/industry-machine-learning
GitHub
GitHub - firmai/industry-machine-learning: A curated list of applied machine learning and data science notebooks and libraries…
A curated list of applied machine learning and data science notebooks and libraries across different industries (by @firmai) - firmai/industry-machine-learning
DevOps Pipeline for a Machine Learning Project
(Applying machine learning to DevOps)
#ML #DevOps
https://blog.statsbot.co/machine-learning-devops-611210393c1a
(Applying machine learning to DevOps)
#ML #DevOps
https://blog.statsbot.co/machine-learning-devops-611210393c1a
Demystifying the Data Science job families.
A layman’s guide to understanding the differences between Data Scientist, Research Scientist, Applied Scientist, and Business Intelligence Engineer
https://towardsdatascience.com/demystifying-the-data-science-job-families-c74f2294b1bd
A layman’s guide to understanding the differences between Data Scientist, Research Scientist, Applied Scientist, and Business Intelligence Engineer
https://towardsdatascience.com/demystifying-the-data-science-job-families-c74f2294b1bd
Medium
Demystifying the Data Science job families
A layman’s guide to understanding the differences between Data Scientist, Research Scientist, Applied Scientist, and Business Intelligence…
Forwarded from Ivan Begtin (Ivan Begtin)
Git для данных - это давняя мечта многих разработчиков и дата-инженеров. Как организовать хранение и передачу данных так чтобы было похоже на систему контроля версий и учитывало объёмы и изменения в наборах данных.
Несколько проектов существуют для решения этой задачи, например такие:
- Dolt [1] [2] - умеет многое, объединять данные, сравнивать, делать таблицы сравнения, разрешать конфликты и тд. плюс многое из возможностей git'а
- Daff [3] позволяет работать с таблицами CSV и также сравнивать их, объединять и тд. Интегрирован с git
- DVC [4] система контроля версиями для проектов по машинному обучению. Довольно популярна и умеет многое связанное с проектами именно по ML
Ссылки:
[1] https://github.com/liquidata-inc/dolt
[2] https://www.dolthub.com/
[3] https://github.com/paulfitz/daff
[4] https://dvc.org/
#opendata #data #git #datatools
Несколько проектов существуют для решения этой задачи, например такие:
- Dolt [1] [2] - умеет многое, объединять данные, сравнивать, делать таблицы сравнения, разрешать конфликты и тд. плюс многое из возможностей git'а
- Daff [3] позволяет работать с таблицами CSV и также сравнивать их, объединять и тд. Интегрирован с git
- DVC [4] система контроля версиями для проектов по машинному обучению. Довольно популярна и умеет многое связанное с проектами именно по ML
Ссылки:
[1] https://github.com/liquidata-inc/dolt
[2] https://www.dolthub.com/
[3] https://github.com/paulfitz/daff
[4] https://dvc.org/
#opendata #data #git #datatools
GitHub
GitHub - dolthub/dolt: Dolt – Git for Data
Dolt – Git for Data. Contribute to dolthub/dolt development by creating an account on GitHub.