Data Science History and Overview
https://www.kdnuggets.com/2020/11/data-science-history-overview.html
https://www.kdnuggets.com/2020/11/data-science-history-overview.html
KDnuggets
Data Science History and Overview - KDnuggets
In this era of big data that is only getting bigger, a huge amount of information from different fields is gathered and stored. Its analysis and extraction of value have become one of the most attractive tasks for companies and society in general, which is…
Introducing Amazon SageMaker Data Wrangler, a Visual Interface to Prepare Data for Machine Learning
Amazon SageMaker Data Wrangler -- a new capability of Amazon SageMaker that makes it faster for data scientists and engineers to prepare data for machine learning (ML) applications by using a visual interface.
https://aws.amazon.com/blogs/aws/introducing-amazon-sagemaker-data-wrangler-a-visual-interface-to-prepare-data-for-machine-learning/
Amazon SageMaker Data Wrangler -- a new capability of Amazon SageMaker that makes it faster for data scientists and engineers to prepare data for machine learning (ML) applications by using a visual interface.
https://aws.amazon.com/blogs/aws/introducing-amazon-sagemaker-data-wrangler-a-visual-interface-to-prepare-data-for-machine-learning/
Amazon
Introducing Amazon SageMaker Data Wrangler, a Visual Interface to Prepare Data for Machine Learning | Amazon Web Services
Today, I’m extremely happy to announce Amazon SageMaker Data Wrangler, a new capability of Amazon SageMaker that makes it faster for data scientists and engineers to prepare data for machine learning (ML) applications by using a visual interface. Whenever…
The Cancer Imaging Archive is a service which de-identifies and hosts a large archive of medical images of cancer accessible for public download. The data are organized as “collections”; typically patients’ imaging related by a common disease (e.g. lung cancer), image modality or type (MRI, CT, digital histopathology, etc) or research focus. DICOM is the primary file format used by TCIA for radiology imaging. Supporting data related to the images such as patient outcomes, treatment details, genomics and expert analyses are also provided when available.
https://www.cancerimagingarchive.net/collections/
https://www.cancerimagingarchive.net/collections/
Дата-завтраки (сообщества ODS) каждое утро: https://www.joinclubhouse.com/room/xq53KVDp
Начало в 9:30.
Заметки о прошедших дата-завтрах можно посмотреть здесь: http://bit.ly/data_zavtrak
Начало в 9:30.
Заметки о прошедших дата-завтрах можно посмотреть здесь: http://bit.ly/data_zavtrak
Clubhouse
Join Clubhouse to find more great rooms.
Machine learning and AI are hot priorities for businesses. But there remains a huge gap between AI aspirations and actual execution. In 2020, only 13% of organizations managed to successfully deploy ML use cases in production and plan to keep scaling them. Why such a low number?
https://neuromation.io/blog/machine-learning-as-a-service/
#MLaaS
https://neuromation.io/blog/machine-learning-as-a-service/
#MLaaS
Neuromation
4 Benefits of Machine Learning as a Service | Neuromation
Machine learning as a service (MLaaS) stands for a standardized setup of cloud-based infrastructure, featuring storage, computing power, supporting tools and libraries, for planning, developing, managing, and deploying ML projects.
У дружественной организации появилась вакансия дата-инженера.
Вот ее описание.
Дата-инженер в Вебиум
Привет! Мы — Вебиум. Нескучная онлайн-школа для тех, кто готовится к экзаменам и хочет во всём разобраться. Мы открытая организация с культурой бирюзового управления, гибким подходом и большой верой в то, что мы делаем!
Более 7 лет помогаем школьникам со всей России готовиться к ЕГЭ. Только в прошлом году с нами занималось более 41,5 тысячи студентов!
🔸 Кого мы ищем?
Мы ищем дата-инженера, готового поддерживать data-driven культуру управления продуктом и маркетингом, обеспечивая всех заинтересованных данными для принятия аргументированных решений.
🔹 Что предстоит делать
- Создавать и оптимизировать ETL процессы выгрузки данных (разовые + автоматизация);
- Контролировать качество данных;
- Оптимизировать работу с базами данных;
- Продумать стратегию развития аналитической инфраструктуры с учетом потребностей бизнеса — выбор технологий и проектирование архитектуры;
- Наладить регулярные процессы подготовки и поставки данных для продуктовых, маркетинговых команд и аналитиков.
Подробнее о том, кого мы ищем и какие условия предоставляем по ссылке: https://www.notion.so/Data-engineer-eb7a5c2c5b4941b3a25a7385bc5bb4e1
Вот ее описание.
Дата-инженер в Вебиум
Привет! Мы — Вебиум. Нескучная онлайн-школа для тех, кто готовится к экзаменам и хочет во всём разобраться. Мы открытая организация с культурой бирюзового управления, гибким подходом и большой верой в то, что мы делаем!
Более 7 лет помогаем школьникам со всей России готовиться к ЕГЭ. Только в прошлом году с нами занималось более 41,5 тысячи студентов!
🔸 Кого мы ищем?
Мы ищем дата-инженера, готового поддерживать data-driven культуру управления продуктом и маркетингом, обеспечивая всех заинтересованных данными для принятия аргументированных решений.
🔹 Что предстоит делать
- Создавать и оптимизировать ETL процессы выгрузки данных (разовые + автоматизация);
- Контролировать качество данных;
- Оптимизировать работу с базами данных;
- Продумать стратегию развития аналитической инфраструктуры с учетом потребностей бизнеса — выбор технологий и проектирование архитектуры;
- Наладить регулярные процессы подготовки и поставки данных для продуктовых, маркетинговых команд и аналитиков.
Подробнее о том, кого мы ищем и какие условия предоставляем по ссылке: https://www.notion.so/Data-engineer-eb7a5c2c5b4941b3a25a7385bc5bb4e1
Вебиум on Notion
Data engineer
Привет! Мы — Вебиум. Нескучная онлайн-школа для тех, кто готовится к экзаменам и хочет во всём разобраться.
Data Scientists and ML Engineers Are Luxury Employees
https://towardsdatascience.com/data-scientist-and-ml-engineers-are-luxury-employees-9ff180f197a3
https://towardsdatascience.com/data-scientist-and-ml-engineers-are-luxury-employees-9ff180f197a3
Medium
Data Scientists and ML Engineers Are Luxury Employees
There is a huge mismatch between what most companies need and what ML practitioners want to do
MLOps Best Practices
https://www.kdnuggets.com/2021/07/mlops-best-practices.html
https://www.kdnuggets.com/2021/07/mlops-best-practices.html
KDnuggets
MLOps Best Practices - KDnuggets
Many technical challenges must be overcome to achieve successful delivery of machine learning solutions at scale. This article shares best practices we encountered while architecting and applying a model deployment platform within a large organization, including…
A Brief Introduction to the Concept of Data
https://www.kdnuggets.com/2021/07/brief-introduction-concept-data.html
https://www.kdnuggets.com/2021/07/brief-introduction-concept-data.html
KDnuggets
A Brief Introduction to the Concept of Data
Every aspiring data scientist must know the concept of data and the kind of analysis they can run. This article introduces the concept of data (quantitative and qualitative) and the types of analysis.
DATApedia - канал про Data Science, и все что связано с данными, в котором вы найдете:
— Переведенные зарубежные статьи, которые есть только у нас;
— Возможность предложить нам статью для перевода;
— Полезные видео;
— Профессиональный юмор;
Присоединяйтесь, давайте расти как профессионалы вместе 😉
https://news.1rj.ru/str/data_science_wiki
— Переведенные зарубежные статьи, которые есть только у нас;
— Возможность предложить нам статью для перевода;
— Полезные видео;
— Профессиональный юмор;
Присоединяйтесь, давайте расти как профессионалы вместе 😉
https://news.1rj.ru/str/data_science_wiki
A Data Management Platform for the global ML community
https://towardsdatascience.com/a-data-management-platform-for-the-global-ml-community-57a15da01bb
Обратите внимание на список интересных ссылок в конце статьи
https://towardsdatascience.com/a-data-management-platform-for-the-global-ml-community-57a15da01bb
Обратите внимание на список интересных ссылок в конце статьи
Medium
A Data Management Platform for the global ML community
To engineer our way out of data engineering and deliver a systematic solution to the data crisis
Forwarded from Типичный программист
Умер Клайв Синклер, создатель компьютера ZX Spectrum — источника целого поколения программистов
40 лет назад Синклер основал Sinclair Research, выпустил недорогой ПК и изменил жизнь миллионов пользователей, позволив им стать программистами, геймерами и инженерами.
Press F.
#история
40 лет назад Синклер основал Sinclair Research, выпустил недорогой ПК и изменил жизнь миллионов пользователей, позволив им стать программистами, геймерами и инженерами.
Press F.
#история
3 Reasons Why AutoML Won’t Replace Data Scientists Yet
https://www.kdnuggets.com/2019/03/why-automl-wont-replace-data-scientists.html
https://www.kdnuggets.com/2019/03/why-automl-wont-replace-data-scientists.html
KDnuggets
3 Reasons Why AutoML Won’t Replace Data Scientists Yet - KDnuggets
We dispel the myth that AutoML is replacing Data Scientists jobs by highlighting three factors in Data Science development that AutoML can’t solve.
Вебинар Бесплатный ML Space на базе инструментов Intel oneAPI для всех желающих.
У нас отличные новости, инструменты Intel® oneAPI на облачной платформе ML Space стали доступны для физических лиц. Это значит, что любой желающий может бесплатно использовать набор программных инструментов для ускорения машинного обучения, анализа данных, разработки ПО.
На вебинаре вы узнаете:
— подробности об инструментах Intel® oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.
Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.
Вебинар пройдёт — 14 октября 2021, четверг, 12:00
*SberCloud — облачный провайдер услуг и сервисов для физлиц, бизнеса и государственных организаций.
У нас отличные новости, инструменты Intel® oneAPI на облачной платформе ML Space стали доступны для физических лиц. Это значит, что любой желающий может бесплатно использовать набор программных инструментов для ускорения машинного обучения, анализа данных, разработки ПО.
На вебинаре вы узнаете:
— подробности об инструментах Intel® oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.
Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.
Вебинар пройдёт — 14 октября 2021, четверг, 12:00
*SberCloud — облачный провайдер услуг и сервисов для физлиц, бизнеса и государственных организаций.
How I got into Big Data?
Data Zen community приглашает на бесплатный online-event
Поговорим о Big Data и обсудим отличия направления в разных странах.
Гость встречи - Izabella Zuk, Senior Data Engineer из EPAM Польша поделится своей историей перехода в Big Data и расскажет, какие знания ей помогли на этом пути.
Регистрируйтесь на event и задавайте интересующие вопросы нашему гостю.
17 ноября, 19.00 (UTC+3)
Ссылка на регистрацию
Data Zen community приглашает на бесплатный online-event
Поговорим о Big Data и обсудим отличия направления в разных странах.
Гость встречи - Izabella Zuk, Senior Data Engineer из EPAM Польша поделится своей историей перехода в Big Data и расскажет, какие знания ей помогли на этом пути.
Регистрируйтесь на event и задавайте интересующие вопросы нашему гостю.
17 ноября, 19.00 (UTC+3)
Ссылка на регистрацию
DATA ZEN PODCAST 🎙
ВЫПУСК #4 Data Base Developer vs Big Data Engineer
Любой разработчик так или иначе сталкивается с базами данных. Чтобы убедиться в этом, достаточно посмотреть требования вакансий: там обязательно будет присутствовать как минимум знание SQL.
Можно было бы предположить, что Биг Дата разработчики плотнее всего работают с данными и базами данных, исходя из названия профессии. Но есть как минимум ещё один вид специалистов, которые могли бы с этим поспорить, - это Database инженеры, которые разрабатывают прямо внутри баз данных.
Различаются ли эти роли, или Биг Дата инженер – это хипстерская версия старого доброго Database разработчика?
Каково это писать на PL/SQL, когда все только и говорят, какой питон удобный?
Всё это в новом выпуске подкаста с Антоном Татариновым (Database Engineer) и Дмитрием Тумиловичем (Big Data Engineer), встречайте!
слушать DATA Zen PODCAST
🎥 YouTube 🔍 Google Podcasts
🎵 Яндекс.Музыка 🍏Apple Podcasts
ВЫПУСК #4 Data Base Developer vs Big Data Engineer
Любой разработчик так или иначе сталкивается с базами данных. Чтобы убедиться в этом, достаточно посмотреть требования вакансий: там обязательно будет присутствовать как минимум знание SQL.
Можно было бы предположить, что Биг Дата разработчики плотнее всего работают с данными и базами данных, исходя из названия профессии. Но есть как минимум ещё один вид специалистов, которые могли бы с этим поспорить, - это Database инженеры, которые разрабатывают прямо внутри баз данных.
Различаются ли эти роли, или Биг Дата инженер – это хипстерская версия старого доброго Database разработчика?
Каково это писать на PL/SQL, когда все только и говорят, какой питон удобный?
Всё это в новом выпуске подкаста с Антоном Татариновым (Database Engineer) и Дмитрием Тумиловичем (Big Data Engineer), встречайте!
слушать DATA Zen PODCAST
🎥 YouTube 🔍 Google Podcasts
🎵 Яндекс.Музыка 🍏Apple Podcasts
Необычный выпуск Data Zen Podcast: поговорим о психологии в IT.
Премьера 1 декабря 12.00 (UTC+3)!
▫️Что нужно знать, чтобы выгорать ровно к началу отпуска?
▫️Как ходить по грани и при этом сохранять рассудок и эффективность?
▫️Как работать 24/7, но продержаться дольше, чем тот парень напротив?
Ирина Каленчук, психолог, карьерный консультант, поделится с нами опытом и подскажет, где искать ментальные силы, когда всё плохо.
Узнаем, кто виноват в выгорании и как понять, что ты следующий, а также зададим интересующие вас вопросы - присылайте их нам.
👁🗨 Анонимность, как и полагается в психологии, гарантируем.
Премьера 1 декабря 12.00 (UTC+3)!
▫️Что нужно знать, чтобы выгорать ровно к началу отпуска?
▫️Как ходить по грани и при этом сохранять рассудок и эффективность?
▫️Как работать 24/7, но продержаться дольше, чем тот парень напротив?
Ирина Каленчук, психолог, карьерный консультант, поделится с нами опытом и подскажет, где искать ментальные силы, когда всё плохо.
Узнаем, кто виноват в выгорании и как понять, что ты следующий, а также зададим интересующие вас вопросы - присылайте их нам.
👁🗨 Анонимность, как и полагается в психологии, гарантируем.
Machine Learning in Production: Why You Should Care About Data and Concept Drift
https://towardsdatascience.com/machine-learning-in-production-why-you-should-care-about-data-and-concept-drift-d96d0bc907fb
https://towardsdatascience.com/machine-learning-in-production-why-you-should-care-about-data-and-concept-drift-d96d0bc907fb
Medium
Machine Learning in Production: Why You Should Care About Data and Concept Drift
No model lasts forever. Even if the data quality is fine, the model itself can start degrading. What does this mean in practice?