Aspiring Data Science – Telegram
Aspiring Data Science
385 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#translations

Постоянно сталкиваюсь с тем, что переведённые книги оставляют впечатление, будто автор - косноязычный даун. Вроде уже прошли 90-е с системой перевода Промпт, но, видно, прромпт живёт у нас в сердцах. Так называемые "переводчики"! Ну нельзя переводить тексты с английского пословно, НЕЛЬЗЯ. Дайте вы немного больше свободы, отклонитесь от грамматической структуры оригинала, но сделайте текст хорошо звучащим на целевом языке. Ну неужели не видите, что у вас получается говно?
#chan #featureselection

Прочитал научную статью Эрни Чана о выборе признаков, разочаровался.

"Feature selection in machine learning is subject to the intrinsic randomness of the feature selection algorithms (e.g. random permutations during MDA). Stability of selected features with respect to such randomness is essential to the human interpretability of a machine learning algorithm. We proposes a rank-based stability metric called ‘instability index’ to compare the stabilities of three feature selection algorithms MDA, LIME, and SHAP as applied to random forests. Typically, features are selected by averaging many random iterations of a selection algorithm. Though we find that the variability of the selected features does decrease as the number of iterations increases, it does not go to zero, and the features selected by the three algorithms do not necessarily converge to the same set. We find LIME and SHAP to be more stable than MDA, and LIME is at least as stable as SHAP for the top ranked features. Hence overall LIME is best suited for human interpretability. However, the selected set of features from all three algorithms significantly improves various predictive metrics out-of-sample, and their predictive performances do not differ significantly. Experiments were conducted on synthetic datasets, two public benchmark datasets, and on proprietary data from an active investment strategy."

https://arxiv.org/ftp/arxiv/papers/2005/2005.12483.pdf
#google #law

Основные тезисы соглашения Google и генпрокуроров штатов в рамках антимонопольного разбирательства.

Google выплатит $700 млн — это операционная прибыль от «Play Маркета» примерно за 21 день.
Из этой суммы $629 млн будут перечислены потребителям, которые, вероятно, переплатили при покупке приложений и проведении микротранзакций в «Play Маркете» в связи с уплатой налогов, гонораров адвокатов и прочими расходами.
Кроме того, $70 млн будут направлены властям штатов на расходы по усмотрению генпрокуроров.
И ещё $1 млн уйдёт на обслуживание этих расчётов.
В течение 7 лет Google «сохранит на Android техническую возможность установки сторонних приложений на мобильные устройства с помощью средств, отличных от Google Play».
В течение 5 лет Google будет позволять разработчикам предлагать альтернативную систему оплаты параллельно с Google Play (User Choice Billing — расчёты по выбору пользователя).
В течение 5 лет Google не будет вынуждать разработчиков предлагать более выгодные цены потребителям, выбирающим Google Play и Google Play Billing.
В течение 4 лет Google не будет вынуждать разработчиков выпускать игры в Google Play одновременно с другими магазинами приложений с равной функциональностью.
В течение 5 лет Google не будет заставлять производителей эксклюзивно устанавливать Google Play на телефон или выводить его на домашний экран.
В течение 4 лет Google не будет запрещать OEM-производителям предоставлять права установщиков для предустановленных приложений.
В течение 5 лет Google не будет требовать своего согласия на предустановку OEM-производителем альтернативного магазина приложений.
В течение 4 лет Google будет позволять сторонним магазинам обновлять приложения без необходимости разрешения от пользователя.
В течение 4 лет Google будет позволять сторонним магазинам приложений использовать свои API и «разделение функций» для облегчения установки приложений.
В течение 5 лет Google превратит два своих «экрана страха» при загрузке сторонних приложений в единое пользовательское соглашение, которое будет читаться как эквивалент согласованного высказывания: «Ваш телефон на текущий момент не настроен на установку приложений из этого источника. Выдача этому источнику разрешения устанавливать приложения может подвергнуть риску ваши телефон и данные».
В течение 5 лет Google будет позволять участвующим в программе User Choice Billing разработчикам сообщать своим пользователям о более выгодных ценах на других площадках и «проводить транзакции, используя существующее веб-решение разработчика для выставления счетов во встроенном веб-интерфейсе в своём приложении».
В течение 6 лет Google сохранит разработчикам возможность использовать контактную информацию, полученную вне приложения или в приложении (с согласия пользователя) для общения с пользователями вне приложения.
В течение 6 лет Google будет позволять приложениям, предназначенным только для потребления (например, Netflix, который не позволяет платить на устройстве через сторонние системы), сообщать пользователям о более выгодных ценах на других площадках без ссылок на внешние сайты — например, с надписями вроде «Доступно на нашем сайте за $9,99».
В течение 6 лет Google не будет запрещать разработчикам раскрывать пользователям любые услуги или иные сборы, связанные с Google Play или платёжной системой Google Play.


https://3dnews.ru/1097696/google-viplatit-700-millionov-i-izmenit-magazin-prilogeniy-chtobi-snyat-pretenzii-amerikanskih-vlastey
#trading

while True:
make_money(now)
🌚1
#food

"В американском городе Пасадена скоро откроется точка быстрого питания CaliExpress by Flippy, в которой будут работать исключительно роботы: клиент сможет сделать заказ на терминале, а затем ему останется наблюдать, как еда готовится машинами. Роботы Flippy будут самостоятельно перемещаться по направляющим на кухне от одной точки к другой, готовя картошку фри и бургеры — на булочке с необходимыми овощами и соусами. Полностью роботизированная закусочная разместится по соседству с традиционной бургерной, где работают живые люди."

https://3dnews.ru/1097767/v-amerikanskoy-pasadene-otkroetsya-polnostyu-robotizirovannaya-burgernaya
#poetry

Смотрит самурай на бэклог задач от 11 декабря. Ни одна не сделана. Грустно.
Forwarded from Alor School
Что Уоррен Баффет думает о техническом анализе?

Регистрируйтесь на бесплатный мастер-класс
Теория эффективного vs теория НЕэффективного рынка
+Опционы без высшей математики

📅 20-21 декабря | 20:00 (мск) | Юрий Красноруцкий

ЗАРЕГИСТРИРОВАТЬСЯ БЕСПЛАТНО по ссылке https://alorschool.ru/effect_vs_neeffect

За 2 дня вы узнаете:
Основные стратегии на линейных рынках
Если индикаторы есть, то кому на самом деле они нужны?
Кто популяризирует технический анализ и для чего?
Искусственный интеллект на службе у частного трейдера
Алгоритмический трейдинг для частных трейдеров
Сеточные роботы-торговцы волатильностью
Стратегии пассивного дохода на бирже
Как начать зарабатывать с первого дня на опционах
Что читать. Кого слушать. Где смотреть.
И МНОГОЕ ДРУГОЕ 🔥

РЕГИСТРИРУЙТЕСЬ БЕСПЛАТНО по ссылке https://alorschool.ru/effect_vs_neeffect

Реклама. ООО "АЛОР +". ИНН: 7709221010, erid: 2SDnjewddya
#health #ml

"Данные для обучения модели life2vec взяты из информации о рынке труда и данных Национального регистра пациентов (LPR) и Статистического управления Дании. Набор данных включает в себя информацию обо всех 6 млн датчан и содержит сведения о доходах, заработной плате, стипендии, типе работы, отрасли, социальных пособиях и т.д. Набор медицинских данных включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и насколько внезапным или срочным было обращение за медицинской помощью. Данные для модели представлены за период с 2008 по 2020 годы, хотя по ограниченной возрастной группе данные брались за период с 2008 по 2016 годы.

Авторы исследования отмечают, что для полномасштабного использования подобной модели в социальных целях необходимо ответить на множество этических вопросов. В то же время они подчёркивают, что широко распространённые механизмы по оценке целевой аудитории для рекламы позволяют узнавать о людях не намного меньше и это уже используется. Так что не будет ничего плохого, если модель сможет предсказать какое-нибудь негативное событие в жизни конкретного человека, которое можно будет избежать тем или иным образом. Дату смерти, кстати, модель предсказывает с точностью в пределах четырёх лет."

https://3dnews.ru/1097785/iskusstvenniy-intellekt-nauchili-predskazivat-sudbu-i-vremya-smerti-lyudey
Forwarded from Лекторий
This media is not supported in your browser
VIEW IN TELEGRAM
Если ты фрилансер — это далеко не повод отказывать себе в шикарном корпоративе.
#визуализация
Лучше решить одну задачу ста способами, чем сто задач одним. Тут то же самое, но с картинками... как 6 чисел визуализировать 100 разными способами.
https://100.datavizproject.com/
Forwarded from ᴢɪᴘ ʟᴏɢ (Kristina Zipa)
This media is not supported in your browser
VIEW IN TELEGRAM
Пробуем FAL - потоковую генерацию deep fake.

Промпт:
a picture of Ariana Grande, elegant, in a white top, with high ponytail, 8k, uhd

реальное время
видео
онлайн
бесплатно
есть артефакты
несоответствие промту: заменил только лицо, одежду и причёску не смог сделать согласно запросу

Эта технология в перспективе воспитает в нас неуверенность, с кем же мы имеем дело на видеосозвоне, и лишит Вована и Лексуса части их уникальности.😯
Представляю, насколько эффективнее мошенники будут разводить родственников с угнанного аккаунта! 👻

Скорее всего, нужно будет изменить наши протоколы коммуникации:
🔣только очные собеседования,
🔣лично и устно переданная секретная информация для идентификации в подозрительных ситуациях (например, мелкие детали общего прошлого).
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from Artem Ryblov’s Data Science Weekly (Artem Ryblov)
Thinking Clearly with Data: A Guide to Quantitative Reasoning and Analysis by Ethan Bueno de Mesquita, Anthony Fowler

An introduction to data science or statistics shouldn’t involve proving complex theorems or memorizing obscure terms and formulas, but that is exactly what most introductory quantitative textbooks emphasize. In contrast, Thinking Clearly with Data focuses, first and foremost, on critical thinking and conceptual understanding in order to teach students how to be better consumers and analysts of the kinds of quantitative information and arguments that they will encounter throughout their lives.

Among much else, the book teaches how to assess whether an observed relationship in data reflects a genuine relationship in the world and, if so, whether it is causal; how to make the most informative comparisons for answering questions; what questions to ask others who are making arguments using quantitative evidence; which statistics are particularly informative or misleading; how quantitative evidence should and shouldn’t influence decision-making; and how to make better decisions by using moral values as well as data.

- An ideal textbook for introductory quantitative methods courses in data science, statistics, political science, economics, psychology, sociology, public policy, and other fields
- Introduces the basic toolkit of data analysis―including sampling, hypothesis testing, Bayesian inference, regression, experiments, instrumental variables, differences in differences, and regression discontinuity
- Uses real-world examples and data from a wide variety of subjects
- Includes practice questions and data exercises

Link: https://www.amazon.com/Thinking-Clearly-Data-Quantitative-Reasoning/dp/0691214352

Navigational hashtags: #armknowledgesharing #armbooks
General hashtags: #datascience #correlation #regression #causation #randomizedexperiments #statistics

@data_science_links
#conformal #mapie #crepes #timeseries

Конформализированная квантильная регрессия - как тебе такое, Илон Маск?!
Для временных рядов важный вопрос заключается в выборе калибрационного множества.

https://www.youtube.com/watch?v=--WcrDRtrYk
2