Aspiring Data Science – Telegram
Aspiring Data Science
386 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#google

"Ещё одна инициатива — программа Project Green Light, направленная на повышение эффективности светофорной регулировки при помощи алгоритмов искусственного интеллекта. По некоторым оценкам, уровни загрязнения воздуха в районе регулируемых светофорами перекрёстков до 29 раз выше, чем на открытых дорогах. ИИ-алгоритмы Project Green Light помогают дорожникам настраивать светофоры таким образом, чтобы минимизировать число остановок при движении машин. Необходимые для этого инструменты чрезвычайно просты в реализации, утверждает Google, а их внедрение занимает считанные минуты. Как показали результаты тестирования системы в ряде городов, число остановок получается сократить на 30 %. Теперь программа Project Green Light будет запущена в Рио-де-Жанейро, Манчестере, Джакарте и Будапеште — всего более десяти городов, а к концу года их число увеличится дополнительно."

https://3dnews.ru/1094263/google-rasshirila-prisutstvie-ekologicheskoy-informatsii-v-svoih-servisah
#полезно
Один интересный кейс, который мне очень нравится: как догадаться до нужной деформации целевых значений.
#gpt #copilot

"Microsoft несёт убытки, предлагая подписку на свой ИИ-сервис GitHub Copilot всего за $10 в месяц, при фактических затратах, превышающих $20 на одного пользователя. Этот случай является лишь вершиной айсберга в сложной экономике ИИ, где расходы на оборудование, энергию и разработку ПО оказываются неоправданно высокими. Компания уже ищет пути оптимизации, включая пересмотр ценовой политики и внедрение более экономичных решений."

Вгоняем, вгоняем мелкомягких в долги!

https://3dnews.ru/1094291/zatrati-na-ii-previsily-dohodi-microsoft-terpit-ubitki-teryaya-bolee-20-na-kagdoy-podpiske-na-github-copilot
#science #fun

наука важнее
💔5
#newyear #poetry #fun

Кстати, новый год близится.

"включаю в полночь телевизор
в эфире ельцын как живой
вещает синими губами
я отдохнул я прихожу"
#ideas #wisdom

"There’s no such thing as a new idea. We simply take a lot of old ideas and put them into a sort of mental kaleidoscope. We keep making new combinations indefinitely, but they are the same old pieces of coloured glass that have been in use through all the ages."

Mark Twain
#evolution #fun

"Быстрее всего эволюционируют всякие электрики, сантехники, отделочники и прочие мастера. Каждый приходящий на порядок умнее предыдущего и спрашивает:

-Что за дебил вам это делал?!"
😁1
#книга
Посмотрел книгу Введение в автоматизированное машинное обучение (AutoML). Главный недостаток - это не совсем книга, это скорее сборник статей, часть построена по принципу обзора по теме со ссылками на первоисточники. Зато попадаются интересные ссылки. Есть главы по Auto-WEKA, Hyperpopt, Auto-sklearn, TPOT (для первичного знакомства, наверное, подойдёт). Последняя глава - обзор результатов давнишних соревнований Изабель Гийон по AutoML.

К слову, создатели LightAutoML сделали курс из коротких видео по своему продукту: https://developers.sber.ru/help/lightautoml
1
Forwarded from Artem Ryblov’s Data Science Weekly (Artem Ryblov)
Feature Engineering and Selection: A Practical Approach for Predictive Models by Max Kuhn and Kjell Johnson

The process of developing predictive models includes many stages. Most resources focus on the modelling algorithms, but neglect other critical aspects of the modelling process. This book describes techniques for finding the best representations of predictors for modelling and for finding the best subset of predictors for improving model performance. A variety of example data sets are used to illustrate the techniques, along with R programs for reproducing the results.

Table of Contents:
1. Introduction
2. Illustrative Example: Predicting Risk of Ischemic Stroke
3. A Review of the Predictive Modeling Process
4. Exploratory Visualizations
5. Encoding Categorical Predictors
6. Engineering Numeric Predictors
7. Detecting Interaction Effects
8. Handling Missing Data
9. Working with Profile Data
10. Feature Selection Overview
11. Greedy Search Methods
12. Global Search Methods

Links:
- http://www.feat.engineering/
- https://www.routledge.com/Feature-Engineering-and-Selection-A-Practical-Approach-for-Predictive-Models/Kuhn-Johnson/p/book/9781138079229
- https://www.routledge.com/Feature-Engineering-and-Selection-A-Practical-Approach-for-Predictive-Models/Kuhn-Johnson/p/book/9781138079229

Navigational hashtags: #armknowledgesharing #armbooks
General hashtags: #machinelearning #ml #featureengineering #featureselection #missingdata #categoricalvariables

@accelerated_learning
👍1
#ml #definitions

На удивление часто встречается определение ML как "обучение компьютеров без явного программирования". А ведь нет ничего более далёкого от истины, так как 90% работы дата сайентиста в ML формально выражается как раз в явном программировании )
👍3