Data Place – Telegram
Data Place
550 subscribers
34 photos
2 files
212 links
Канал про данные, науку о данных и про обучение работе с данными.
Автор: Ирина Радченко, доцент, канд. техн. наук, любитель данных и Computer Science, в Телеграме -- @dadaistka
Download Telegram
DevOps Pipeline for a Machine Learning Project
(Applying machine learning to DevOps)
#ML #DevOps
https://blog.statsbot.co/machine-learning-devops-611210393c1a
Demystifying the Data Science job families.
A layman’s guide to understanding the differences between Data Scientist, Research Scientist, Applied Scientist, and Business Intelligence Engineer

https://towardsdatascience.com/demystifying-the-data-science-job-families-c74f2294b1bd
Forwarded from Ivan Begtin (Ivan Begtin)
Git для данных - это давняя мечта многих разработчиков и дата-инженеров. Как организовать хранение и передачу данных так чтобы было похоже на систему контроля версий и учитывало объёмы и изменения в наборах данных.

Несколько проектов существуют для решения этой задачи, например такие:
- Dolt [1] [2] - умеет многое, объединять данные, сравнивать, делать таблицы сравнения, разрешать конфликты и тд. плюс многое из возможностей git'а
- Daff [3] позволяет работать с таблицами CSV и также сравнивать их, объединять и тд. Интегрирован с git
- DVC [4] система контроля версиями для проектов по машинному обучению. Довольно популярна и умеет многое связанное с проектами именно по ML


Ссылки:
[1] https://github.com/liquidata-inc/dolt
[2] https://www.dolthub.com/
[3] https://github.com/paulfitz/daff
[4] https://dvc.org/

#opendata #data #git #datatools
Forwarded from Pusheen Machine
Заметки, сверстанные в LaTeX с конференции ICML-2019
https://david-abel.github.io/notes/icml_2019.pdf

Дэвид Абель, PhD студент из Брауновского университета, сделал офигенный документ об International Conference on Machine Learning, которая прошла 9 июня недалеко от Лос-Анджелеса. В основном, он делал упор на лекции о reinforcement learning, но и другие темы там тоже есть. Он даже формулы все сверстал!

Вот бы с каждой конференции были такие документы 😌
Forwarded from DevOps&SRE Library
Free for developers

Список полезных бесплатных облачных сервисов для разработчиков.

https://free-for.dev
Unicorn Data Scientist
WWW vs Internet

Tim Berners Lee and Vint Cerf explains the difference between WWW and the Internet.
Deep Fake Science, кризис воспроизводимости и откуда берутся пустые репозитории

https://habr.com/en/post/480348/deep/
Forwarded from Типичный программист
Вот уже 57 лет 82-летний Дональд Кнут работает над своей книгой по алгоритмам «Искусство программирования». Это лучшая книга по алгоритмам, которая признана Стэнфордским университетом одним из лучших научных трудов века.

Не забывает Дональд Кнут и общаться со студентами. В начале декабря он провёл юбилейную 25-ю лекцию «У рождественской ёлки». Здесь можно посмотреть запись лекции и её краткий текстовый обзор:

https://tprg.ru/PIU2

#кнут #математика