Aspiring Data Science – Telegram
Aspiring Data Science
386 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#evolution #fun

"Быстрее всего эволюционируют всякие электрики, сантехники, отделочники и прочие мастера. Каждый приходящий на порядок умнее предыдущего и спрашивает:

-Что за дебил вам это делал?!"
😁1
#книга
Посмотрел книгу Введение в автоматизированное машинное обучение (AutoML). Главный недостаток - это не совсем книга, это скорее сборник статей, часть построена по принципу обзора по теме со ссылками на первоисточники. Зато попадаются интересные ссылки. Есть главы по Auto-WEKA, Hyperpopt, Auto-sklearn, TPOT (для первичного знакомства, наверное, подойдёт). Последняя глава - обзор результатов давнишних соревнований Изабель Гийон по AutoML.

К слову, создатели LightAutoML сделали курс из коротких видео по своему продукту: https://developers.sber.ru/help/lightautoml
1
Forwarded from Artem Ryblov’s Data Science Weekly (Artem Ryblov)
Feature Engineering and Selection: A Practical Approach for Predictive Models by Max Kuhn and Kjell Johnson

The process of developing predictive models includes many stages. Most resources focus on the modelling algorithms, but neglect other critical aspects of the modelling process. This book describes techniques for finding the best representations of predictors for modelling and for finding the best subset of predictors for improving model performance. A variety of example data sets are used to illustrate the techniques, along with R programs for reproducing the results.

Table of Contents:
1. Introduction
2. Illustrative Example: Predicting Risk of Ischemic Stroke
3. A Review of the Predictive Modeling Process
4. Exploratory Visualizations
5. Encoding Categorical Predictors
6. Engineering Numeric Predictors
7. Detecting Interaction Effects
8. Handling Missing Data
9. Working with Profile Data
10. Feature Selection Overview
11. Greedy Search Methods
12. Global Search Methods

Links:
- http://www.feat.engineering/
- https://www.routledge.com/Feature-Engineering-and-Selection-A-Practical-Approach-for-Predictive-Models/Kuhn-Johnson/p/book/9781138079229
- https://www.routledge.com/Feature-Engineering-and-Selection-A-Practical-Approach-for-Predictive-Models/Kuhn-Johnson/p/book/9781138079229

Navigational hashtags: #armknowledgesharing #armbooks
General hashtags: #machinelearning #ml #featureengineering #featureselection #missingdata #categoricalvariables

@accelerated_learning
👍1
#ml #definitions

На удивление часто встречается определение ML как "обучение компьютеров без явного программирования". А ведь нет ничего более далёкого от истины, так как 90% работы дата сайентиста в ML формально выражается как раз в явном программировании )
👍3
🎓 Курсы и вебинары, которые пройдут на этой неделе

«Опционы: основы торговли»
На бесплатном вебинаре вы узнаете, как выбирать подходящие для вашей стратегии деривативы, как продавать и покупать опционы, а также настроите специальную программу для торговли QUIK.

«Скальпинг: авторская стратегия — 2023 на практике»
На курсе вы разберете стратегию скальпинга, поймете, как торговать спокойно и эмоционально адаптироваться под ситуацию, а также увидите примеры реальных сделок, заключенных по авторской методике.

«Опционные стратегии для начинающих трейдеров»
Спикер расскажет, как торговать опционами без погружения в сложную математику, как использовать опционы для хеджирования рисков и как создавать и реализовывать разные стратегии в трейдинге.

Будем ждать вас на занятиях! А если не сможете прийти на онлайн-уроки, вышлем запись и все необходимые материалы — нужно будет только зарегистрироваться по ссылкам на интересующие вебинары.
Please open Telegram to view this post
VIEW IN TELEGRAM
#featureselection #knockoffs #hmm #fdr

“The Knockoffs Framework: New Statistical Tools for Replicable Selections”
Emmanuel Candès, Stanford University

Abstract: A common problem in modern statistical applications is to select, from a large set of candidates, a subset of variables which are important for determining an outcome of interest. For instance, the outcome may be disease status and the variables may be hundreds of thousands of single nucleotide polymorphisms on the genome. In this talk, we develop an entirely new read of the knockoffs framework of Barber and Candès (2015), which proposes a general solution to perform variable selection under rigorous type-I error control, without relying on strong modeling assumptions. We show how to apply this solution to a rich family of problems where the distribution of the covariates can be described by a hidden Markov model (HMM). In particular, we develop an exact and efficient algorithm to sample knockoff copies of an HMM, and then argue that combined with the knockoffs selective framework, they provide a natural and powerful tool for performing principled inference in genome-wide association studies with guaranteed FDR control. Finally, our methodology is applied to several datasets aimed at studying the Crohn’s disease and several continuous phenotypes, e.g. levels of cholesterol.

This is joint work with Rina Barber, Yingying Fan, Lucas Janson, Jinchi Lv, Chiara Sabatti and Matteo Sesia.

Institute for Pure and Applied Mathematics, UCLA
September 27, 2018

https://www.youtube.com/watch?v=NuVBHXYBC4k
#war #politics #relocation #savva

Поразительно, какая каша у этого человека (математика, доктора наук) в голове. Корпорации хотят чтоб люди не размножались, религиозное знание достоверно. Миллионы самых активных и умных людей, покинувшие Россию после начала войны - глупцы, не способные предвидеть последствия своих поступков.

https://www.youtube.com/watch?v=UabGSrpEV5c
#hardware #cpu #amd

"Флагманской моделью серии является 96-ядерный Ryzen Threadripper PRO 7995WX с поддержкой 192 виртуальных потоков, работающий в диапазоне частот от 2,5 до 5,1 ГГц. Процессоры Ryzen Threadripper PRO 7000 предназначены для использования с новой платформой WRX90. Для неё заявляется поддержка восьмиканальной оперативной памяти DDR5-5200 общим объёмом до 2 Тбайт, поддержка 148 (доступны 144) линий PCIe, до 128 из которых относятся к стандарту PCIe 5.0, поддержка разгона процессоров, оперативной памяти, а также наличие дополнительных функций для удалённого управления и повышения безопасности."

https://3dnews.ru/1094721/amd-predstavila-desktopnie-hedtprotsessori-ryzen-threadripper-7000-i-modeli-ryzen-threadripper-7000-pro-dlya-rabochih-stantsiy