О Канбан Методе и девяти ценностях (в том числе, балансе и клиентоориентированности), о процессе реализации в организационном контексте и просто управлении.
А тут еще раз убедимся в том, что управление проектами — это всегда работа с людьми. Интересно будет руководителям проектов любого масштаба.
О том, как правильно распределять задачи, мотивировать и давать обратную связь. Интересное сравнение: опыт руководства = катание на сноуборде в тумане: ты ничего не видишь, ничего не понимаешь и все время вынужден «щупать склон». Добро пожаловать в дивный новый мир!
Почему возникают «пять пороков команды»? Взаимное недоверие, нетребовательность, безответственность, боязнь конфликта и безразличие к результатам. Как их диагностировать и что с ними делать?
Эта книга предназначена для читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе.
Книга поможет раскрыть свой секрет успеха и продуктивности.
О системном подходе к определению жизненных целей.
Советуйте в комментариях, какие еще книги достойны внимания. А если читали что-то из перечисленного — делитесь мнением.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥6❤🔥4
🎛 Обзор открытых промышленных данных
Наверно, ни для кого не секрет, что промышленные данные часто являются закрытыми и не публикуются в открытых источниках. Владельцы настолько ценят свои данные, что даже до сих пор нет рынка промышленных данных. А область анализа данных и машинного обучения ну очень сильно опирается на открытые разработки, библиотеки, исследования и датасеты.
🌍 В рамках популяризации DS/ML в промышленности я продолжаю делиться накопленными знаниями и предлагаю подборку отобранных датасетов для основных задач (по одному датасету на задачу):
• Tool wear detection - NASA Milling Dataset
• Process monitoring (changepoint detection) - SKAB
• Process monitoring (outlier detection) - NASA Shuttle Valve Data
• Product quality prediction - Bosch Production Line Performance
• RUL determining - NPP power transformer RUL
• Process characteristics forecasting - Ladle-furnace unit
• (Бонус) Industrial Cyber Attack detection - репозиторий сразу с 3мя датасетами
Но есть и более представительные подборки промышленных датасетов, например, эта и эта. Очень рекомендую!
🔁 Наконец, в своем репозитории «ML в промышленности», который раньше содержал только кейсы, тоже начал собирать датасеты для полноты картины, а то в репозиториях выше отличные подборки, но недостаточно полные. Свой репозиторий планирую обновлять регулярно, так что подписывайтесь на гитхаб.
Наверно, ни для кого не секрет, что промышленные данные часто являются закрытыми и не публикуются в открытых источниках. Владельцы настолько ценят свои данные, что даже до сих пор нет рынка промышленных данных. А область анализа данных и машинного обучения ну очень сильно опирается на открытые разработки, библиотеки, исследования и датасеты.
• Tool wear detection - NASA Milling Dataset
• Process monitoring (changepoint detection) - SKAB
• Process monitoring (outlier detection) - NASA Shuttle Valve Data
• Product quality prediction - Bosch Production Line Performance
• RUL determining - NPP power transformer RUL
• Process characteristics forecasting - Ladle-furnace unit
• (Бонус) Industrial Cyber Attack detection - репозиторий сразу с 3мя датасетами
Но есть и более представительные подборки промышленных датасетов, например, эта и эта. Очень рекомендую!
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
Industrial-ML/datasets.md at main · YKatser/Industrial-ML
An overview of cases, public datasets, books and academic papers related to applying ML in industrial applications - YKatser/Industrial-ML
👍22🔥12❤3
73.-bokchapter.87583.pdf
412.1 KB
Кстати, ищу научные статьи на следующих ресурсах:
• Упомянутый scholar.google
• Researchgate
• Если полного текста статьи нет в открытом доступе, но у вас есть название или doi, то скорее всего вам поможет sci-hub (есть бот в тг)
И еще лайфхак: на scholar.google и Researchgate пользуюсь рекомендательными движками статей по области интересов, обычно именно оттуда и достаю новые работы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤🔥6🔥5
🗣Анонс выступления
Что?
Доклад "ИИ для диагностики АЭС: обзор мирового опыта"
Когда?
15 сентября 2023 в 11.25 по мск
Где?
Конференция CrossConf. Москва, Красный Октябрь,
пространство Старт Хаб
О чем?
Целью доклада является изучение и обобщение мирового и Российского опыта использования алгоритмов искусственного интеллекта для улучшения диагностики оборудования АЭС, а также демонстрация реальных практических кейсов применения машинного обучения на АЭС.
В этом докладе хочется агрегировать собственный (ранее не опубликованный) опыт в области диагностики из атомного прошлого
Что?
Доклад "ИИ для диагностики АЭС: обзор мирового опыта"
Когда?
15 сентября 2023 в 11.25 по мск
Где?
Конференция CrossConf. Москва, Красный Октябрь,
пространство Старт Хаб
О чем?
Целью доклада является изучение и обобщение мирового и Российского опыта использования алгоритмов искусственного интеллекта для улучшения диагностики оборудования АЭС, а также демонстрация реальных практических кейсов применения машинного обучения на АЭС.
В этом докладе хочется агрегировать собственный (ранее не опубликованный) опыт в области диагностики из атомного прошлого
👍9❤🔥4👏3❤2
🛠 В этом посте писал про решение задачи определения остаточного ресурса для трансформаторов АЭС. Напомню, что решение задачи доступно в посте на хабре. Также теперь на medium доступен перевод статьи на английский.
🎛 Наконец, хотел снова затронуть тему публичных наборов промышленных данных и дополнить этот пост. Для задачи остаточного ресурса (RUL) существует совсем немного таких датасетов, вот список наиболее представительных (разных по сложности, отрасли и другим характеристикам):
- NASA Bearing Dataset
- Battery Remaining Useful Life (RUL)
- NASA Turbofan Jet Engine Data Set. О нем упоминал в этом посте, там больше информации и контекста
- Water Pump RUL
- NPP power transformer RUL. Датасет, на котором и продемонстрировано решение задачи определения остаточного ресурса для трансформаторов АЭС по ссылкам выше
🆓 Все ссылки на Kaggle, поэтому польза их еще и в том, что можете найти там блокноты с примерами решения задачи на датасете и подчерпнуть для себя что-то новое.
🎛 Наконец, хотел снова затронуть тему публичных наборов промышленных данных и дополнить этот пост. Для задачи остаточного ресурса (RUL) существует совсем немного таких датасетов, вот список наиболее представительных (разных по сложности, отрасли и другим характеристикам):
- NASA Bearing Dataset
- Battery Remaining Useful Life (RUL)
- NASA Turbofan Jet Engine Data Set. О нем упоминал в этом посте, там больше информации и контекста
- Water Pump RUL
- NPP power transformer RUL. Датасет, на котором и продемонстрировано решение задачи определения остаточного ресурса для трансформаторов АЭС по ссылкам выше
Please open Telegram to view this post
VIEW IN TELEGRAM
Medium
How to Determine the Remaining Useful Life (RUL) of Industrial Equipement Using Python and Machine Learning
Scope: The objective of writing this article was to set the remaining useful life (RUL) problem, with data, and show an approach to it, and…
👍15🔥3👏3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4👌3❤1❤🔥1👏1
Временные ряды - особенный тип данных, требующий часто специфичных подходов к работе. Это обусловлено, например, индексированностью (определенным порядком) точек данных. Мы можем случайно «заглянуть в будущее» неправильно оценить качество моделей. Поэтому даже кросс-валидация строится не так как на табличных данных.
Но в этом посте хочется поговорить о нескольких интересных и не самых простых методах анализа временных рядов из очень полезных библиотек statsmodel и scipy. Берите методы и библиотеку на вооружение! Подробнее в карточках
Что еще почитать по теме?
У меня в закладках накопилось много материалов, вот несколько наиболее общих по теме анализа временных рядов:
• YouTube - Очень полный воркшоп-лекция об анализе временных рядов (на англ)
• YouTube - Одна из лучших лекций на русском про прогнозирование временных рядов
• Github - Набор блокнотов и презентация по анализу временных рядов (на англ)
Ну и еще отлично дополнит этот пост:
• Про определение периода в данных
Обязательно делитесь интересными постами по теме и другими методами в комментариях
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍9❤🔥4
Часть 1 здесь. Научная статья по кейсу здесь
В качестве алгоритма обнаружения аномалий в работе был выбран наиболее распространенный алгоритм - на основе генерации и оценки невязки (расхождения, англ - discrepancy или residuals). Одним из преимуществ алгоритма является необходимость иметь только нормальный режим работы оборудования в исторических данных.
Но сначала давайте немного синхронизируемся в терминологии:
• Модель машинного обучения - функция, отображающая или переводящая объекты (исходные данные) в предсказания (таргет или ответы)
• Алгоритм или метод машинного обучения - процедура или пайплайн, позволяющая превращать обучающую выборку в обученную модель или строить (обучать, подбирать параметры) модель на основе данных
• Алгоритм решения задачи (в нашем случае алгоритм поиска аномалий) - это последовательность действий или пайплайн, приводящий к получению результата в терминах бизнеса. Более общее понятие, чем алгоритм машинного обучения. Может содержать препроцессинг, модель машинного обучения и постпроцессинг
Конечно, модель машинного обучения может являться алгоритмом поиска аномалий, например, если задача ставится как бинарная классификация событий (часто в задачах детекции фрода), то кроме классификатора нам больше ничего и не нужно, как правило. Но чаще модель - всего лишь часть алгоритма решения задачи.
О самом алгоритме на основе генерации и оценки невязки рассказано в карточках 👆
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥6👏3