NEW BOT Телеграм, страница

Aspiring Data Science

#xgboost #hyperparameters

Приятное описание гиперпараметров xgbost-а, с картинками.

https://towardsdatascience.com/visualizing-xgboost-parameters-a-data-scientists-guide-to-better-models-38757486b813

Medium

Visualizing XGBoost Parameters: A Data Scientist’s Guide To Better Models

Why understanding parameters is critical to building robust models

205 viewsAnatoly Alekseev, 17:43

Aspiring Data Science

#crypto #trading

"Запущенный Дональдом Трампом (Donald Trump) в пятницу мемкоин в воскресенье взлетел до $74,59, а сегодня зафиксировался на $52,71. Это обеспечило новому токену рыночную капитализацию около $10,7 млрд долларов, поставив его на 18-е место среди крупнейших криптовалют. 24-часовой объем торговли $TRUMP достиг $52,5 млрд. На этом фоне биткоин достиг рекордного максимума в $109 072 всего за несколько часов до возвращения избранного президента США в Белый дом.

За два дня до вступления в должность избранный президент США Дональд Трамп (Donald Trump) опубликовал в соцсети X «официальный мем» — криптовалюту, посвящённую своей победе на выборах. Из общего числа в почти 1 млрд токенов 80 % принадлежат CIC Digital LLC, которая является филиалом The Trump Organization, и ещё одному бизнесу Трампа под названием Fight LLC. Таким образом на момент подготовки данного материала состояние Трампа в его собственных мемкоинах оценивается примерно в $40 млрд.

Токен $TRUMP, выпущенный на блокчейне Solana, значительно обогатил Трампа лично, позволил криптоиндустрии перекачивать ему деньги и создала нестабильный финансовый актив, который даёт возможность любому человеку в мире финансово спекулировать на политических состояниях Трампа. Официальный сайт монеты GetTrumpMemes.com призывает посетителей покупать монеты за доллары или криптовалюту, чтобы «отпраздновать нашу победу и повеселиться!».

В воскресенье по примеру супруга Мелания Трамп (Melania Trump) запустила собственную криптовалюту на блокчейне Solana, которая также быстро взлетела в цена и достигла $9,6 за монету, а её рыночная капитализация перевалила за $1,85 млрд.

Трамп пообещал стать «криптопрезидентом» и, как ожидается, издаст указы, направленные на сокращение препятствий для регулирования криптовалют и содействие широкому внедрению цифровых активов. Перспектива смягчения регулирования политики в отношении криптовалют была встречена отраслью с энтузиазмом и спровоцировала рост биткоина после победы Трампа на выборах в ноябре.

Статья Конституции США о вознаграждениях, написанная в 1787 году, вряд ли предполагала мир, в котором президент мог бы из ничего создавать миллиарды долларов личного состояния. В настоящее время невозможно отследить, кто будет покупать эту монету в течение следующих трёх лет и тем самым направлять свои деньги непосредственно Трампу. Учитывая обширный взгляд Верховного суда на президентский иммунитет, есть большая вероятность, что любые подобные действия будут признаны законными.

Трамп только что провёл мастер-класс по способности президента превращать власть в богатство."

https://3dnews.ru/1117007/prezidentskiy-masterklass-za-dva-vihodnih-dnya-tramp-sdelal-sebya-kriptomilliarderom

3DNews - Daily Digital Digest

За выходные Трамп сделал себя криптомиллиардером

Запущенный Дональдом Трампом (Donald Trump) в пятницу мемкоин в воскресенье взлетел до $74,59, а сегодня зафиксировался на $52,71.

130 viewsAnatoly Alekseev, 23:32

Aspiring Data Science

#chess

https://www.youtube.com/watch?v=bl5C2Q4srJs

YouTube

Из Ада в Чемпионы. Откровения 18-летнего чемпиона мира по шахматам Володара Мурзина

Врывайся в лучшую обучающую программу до 1 разряда — https://school.chessmaestro.ru/winners

Качественный мерч ChessMaster — https://school.chessmaestro.ru/shop

Благодарим https://news.1rj.ru/str/parkstudiopro за съемку подкаста

♔ В первом выпуске Chessтного подкаста…

126 viewsAnatoly Alekseev, 15:29

Aspiring Data Science

#python #debugging #ic #icecream

from icecream import ic

# Using ic() to debug
ic(add(10, 20))
ic(add(30, 40))

ic| add(10, 20): 30
ic| add(30, 40): 70

ic.disable()  # Disables ic()
ic(multiply(3, 3))  # Prints nothing

ic.enable()  # Re-enables ic()
ic(multiply(3, 3))  # Output: ic| multiply(3, 3): 9

def log_to_file(text):
    with open("debug.log", "a") as f:
        f.write(text + "\n")

ic.configureOutput(prefix="DEBUG| ", outputFunction=log_to_file)

ic(multiply(7, 7))

https://medium.com/pythoneers/debugging-in-python-replace-print-with-ic-and-do-it-like-a-pro-18f330c863cb

Medium

Debugging in Python: Replace print() with ic() and Do It Like a Pro

Introduction:

✍1

174 viewsAnatoly Alekseev, 11:34

Aspiring Data Science

#biology #evolution
https://youtu.be/ghp4i-9sL10?si=GkC-u7eJrD8eF5XF

YouTube

Александр Марков - Теория эволюции Дарвина

ВКонтакте:http://vk.com/Kognitivnaja_Nauka
Марков Александр Владимирович - доктор биологических наук, ведущий научный сотрудник Палеонтологического института РАН. В 2014 году стал заведующим кафедрой биологической эволюции биологического факультета МГУ. …

114 viewsAnatoly Alekseev, edited 21:51

Aspiring Data Science

#calibration #probabilistic

https://www.youtube.com/watch?v=RXMu96RJj_s

YouTube

Safe Handling Instructions for Probabilistic Classification | SciPy 2019 | Gordon Chen

In machine learning, a common task is to predict whether an unclassified observation belongs to one class or another. However, people are often actually more interested to know the probability of belonging to a class rather than just the most likely class.…

122 viewsAnatoly Alekseev, 20:32

Aspiring Data Science

#hpo #hpt #dask #hyperband

https://www.youtube.com/watch?v=x67K9FiPFBQ

YouTube

Better and Faster Hyper Parameter Optimization with Dask | SciPy 2019 | Scott Sievert

Nearly every machine learning model requires that the user specify certain parameters before training begins, aka "hyper-parameters". Finding the optimal set of hyper-parameters is often a time- and resource-consuming process. A recent breakthrough hyper…

117 viewsAnatoly Alekseev, 01:24

Aspiring Data Science

#hpo #hpt #sigopt

Имхо SigOpt - это лучший оптимизатор (не только для ML). Почему я так считаю, поймёте сразу, увидев пример использования их платформы и сравнив с примером Оптуны. Кстати, в сети мне не удалось найти нормального сравнения оптимизаторов гиперпарамертов, ни одного нормального на конкретных примерах, ну хотя бы Optuna Vs HyperOpt. В документации CatBoost есть такие примеры, но они показывают различия в 3м знаке после запятой, а на практике различия бывают очень весомые.

https://github.com/sigopt/sigopt-examples/blob/main/xgboost-integration-examples/xgb-integration-py-class.ipynb

108 viewsAnatoly Alekseev, edited 08:50

Aspiring Data Science

#trading #backtesting #optimization #sigopt

https://youtu.be/gFPZLpyv774?si=f1bfC2WacedM6O83

YouTube

Tuning for Systematic Trading: Intuition Behind Bayesian Optimization

To kick off our first session, we will introduce Bayesian optimization and some advanced features that can help you optimize model performance. We cover:

🟢 Intelligent Tuning with Bayesian Optimization: How to solve a black-box optimization problems and…

124 viewsAnatoly Alekseev, 11:40

Aspiring Data Science

#hpt #hpo #sigopt

https://www.youtube.com/watch?v=kpcg7hnBUic

YouTube

Advanced Techniques to Accelerate Model Training & Tuning

Presented by Michael McCourt, Head of Engineering, at the Software for AI Optimization Summit 2021.

Michael McCourt discusses the algorithms and associated implementations that power SigOpt, a platform for efficiently conducting model development and hyperparameter…

104 viewsAnatoly Alekseev, 15:35

Aspiring Data Science

#hpo #hpt

Давайте честно, 1% улучшения - это жопа какая-то, впустую потраченное время.

102 viewsAnatoly Alekseev, 15:38

Aspiring Data Science

#hpt #hpo #hyperband #multitask_bayesian

https://www.youtube.com/watch?v=G00fVTKbmZE

YouTube

GTC Silicon Valley 2019: Tuning the Un-Tunable: Lessons for Tuning Expensive Deep Learning Functions

Training and tuning models with lengthy training cycles like those in deep learning can be extremely expensive and may sometimes involve techniques that degrade performance. In this talk, we explore recent research on optimization strategies to efficiently…

114 viewsAnatoly Alekseev, edited 16:31

Aspiring Data Science

#hpt #hpo #smac

Классное выступление. Уже было, наверное, но стоит повторить. Надо потестить этот SMAC, он близок к тому, что я хочу сделать.

https://youtu.be/IqQT8se9ofQ?si=teJh0qucWuWkRzwC

YouTube

Dan Ryan: Efficient and Flexible Hyperparameter Optimization | PyData Miami 2019

Hyperparameter optimization (HPO) is crucial for getting the best performance possible out of your machine learning models. BOHB (Bayesian Optimization and Hyperband) is a recently developed algorithm that combines the best parts of two popular approaches…

100 viewsAnatoly Alekseev, edited 03:59

Aspiring Data Science

#hpt #hpo #critics

Суммаризировал свои претензии к современным подборщикам гиперпараметров.

1) Не надо говорить, что тюнинг моделей - это black box optimization. Никакая это не новая уникальная задача, где неизвестно, что происходит под капотом, мы одну и ту же задачу решаем день за днём, день за днём, даже данные зачастую похожи. Можно, конечно, притворяться, что для нас каждый раз как первый раз, но имхо это тупо.

2) Вот хочу я затюнить градиентный бустинг над деревьями с помощью Optuna или Hyperopt. Почему я должен каждый раз указывать, какие гиперпараметры я хочу оптимизировать? Они что, часто меняются у xgboost-а? В современных моделях их несколько десятков. Я не хочу их все помнить. Я не знаю, какие из них важны. Я не хочу каждый раз разбираться, какие комбинации совместимы, а какие нет. Ваша библиотека мне жизнь упрощать собирается или нет?

3) Хоть как-то учитываются значения целевой функции в ближайших окрестностях найденных оптимальных параметров? Да конечно, нет, всем начхать на это, тебе находят точечное "лучшее" решение, которое потом на поверку оказывается крайне нестабильным.

4) Байесовская оптимизация с помощью гауссовых процессов - ну это не круто, слишком слабая модель. Вы хоть раз слышали, чтобы сореву на каггле выиграли гауссовым процессом?

5) мне не нравится, что всё CPU/GPU время, которое я палю при HPT некоторой задачи, служит лишь какой-то временной цели, никак не обобщается, и никак не поможет мне (или другим людям) при решении подобных задач в будущем.

6) Ни в одной доке библиотек HPO/HPT я не видел оценок, каких же преимуществ, в терминах ML метрик, можно ждать от тюнинга. Казалось бы, авторы проводят много тестов, в т.ч. автоматизированных, им и карты в руки, ну поделитесь вы статистикой? но нет.

7) а хоть одна из библиотек байесовской оптимизации, предлагая очередных кандидатов, вообще оценивает время обучения модели при таких параметрах?

8) вопрос к алгоритмам HalvingSearch/Hyperband, а насколько надёжно по ранним итерациям можно судить о том, какая метрика будет достигнута к концу обучения? А как же нелинейности кривой обучения? А мы точно так не откинем хорошие решения, которые наибольший "импульс" получают к концу обучения?

9) а хоть одна библа вообще смотрит на декоррелированность прогнозов модели с прогнозами других моделей? это же такая естественная мысль. моделька же не в вакууме будет жить, а, скорей всего, в ансамбле.

THERE SHOULD BE A BETTER WAY!!

❤3💯3

156 viewsAnatoly Alekseev, edited 05:55

Aspiring Data Science

#biology
Оказывается, ракообразные - это предки насекомых.

https://youtu.be/5JMisUfHduE?si=8YQSx8zc-R3Rp7Km

YouTube

Александр Марков: "Открытия в эволюции. Итоги 2020 года"

Лекция состоялась 20 февраля 2021 года в Культурно-просветительском центре "Архэ" (https://arhe.msk.ru/)

В 2020 году ученые наконец приблизились к разгадке тайны происхождения крыльев насекомых. Получены новые аргументы в пользу гипотезы, согласно которой…

83 viewsAnatoly Alekseev, edited 23:56

Aspiring Data Science

#python #asyncio

https://medium.com/techtofreedom/9-levels-of-asynchronous-programming-in-python-3755f80403c9

Medium

9 Levels of Asynchronous Programming in Python

From beginner basics to advanced concurrency mastery

👍2

106 viewsAnatoly Alekseev, 08:55

Aspiring Data Science

#llms #ai #deepseek #nvidia

"Всё дело в китайском стартапе DeepSeek, который нашёл способ обучать продвинутые ИИ-модели на малом количестве ускорителей вычислений. Например, при обучении одной из своих моделей на внушительных 685 млрд параметров DeepSeek использовала всего 2048 ИИ-ускорителей Nvidia H800 и потратила $5,6 млн. Это мизерная часть расходов OpenAI и Google на обучение моделей сопоставимого размера.

Кроме того, на прошлой неделе DeepSeek выпустила «рассуждающую» модель ИИ R1, которая превзошла мыслящую OpenAI o1 в важных тестах. Более того, компания опубликовала инструкции, как с минимальными затратами построить большую языковую модель, способную самостоятельно обучаться и совершенствоваться без контроля со стороны человека. Добавим, что многие свои разработки DeepSeek распространяет совершенно бесплатно. Да и платный доступ к наиболее продвинутым её системам оказывается намного дешевле, чем у конкурентов — например, R1 доступна через API компании по цене, которая на 90–95 % ниже, чем у OpenAI o1.

В итоге инвесторы поняли, что нейросети можно обучать не только по схеме «купи и установи как можно больше ускорителей вычислений», но и куда более эффективно на меньшем числе GPU. Это грозит резким падением спроса на продукцию Nvidia, выручка которой более чем на 80 % зависит как раз от ускорителей вычислений.

Ряд аналитиков предрекает Nvidia мрачное будущее и не рекомендуют пока покупать акции компании, хотя цены на них стали заманчивыми. Другие же наоборот уверены, что компания сможет быстро восстановиться, а нынешний спад как раз следует использовать для покупки акций."

https://3dnews.ru/1117353/iipuzir-lopnul-stoimost-nvidia-obvalilas-na-600-mlrd

3DNews - Daily Digital Digest

ИИ-пузырь лопнул: стоимость Nvidia рухнула на $600 млрд за сутки из-за китайского стартапа DeepSeek

Понедельник, 27 января 2025 года, войдёт в историю как один из худших дней для технологических компаний со всего мира — акции большинства из них упали на фоне успеха китайского ИИ-стартапа DeepSeek. Хуже всех пришлось компании Nvidia — её капитализация рухнула…

95 viewsAnatoly Alekseev, edited 14:51

Aspiring Data Science

#llms #ai #deepseek

https://3dnews.ru/1117365/tramp-i-altman-visoko-otsenili-uspehi-deepseek-no-prizvali-ne-umalyat-potentsial-ssha

3DNews - Daily Digital Digest

Трамп и Альтман высоко оценили успехи китайского ИИ-стартапа DeepSeek и заявили, что США смогут лучше

Распространение новейшей языковой модели китайской компании DeepSeek зародило в умах инвесторов сомнения по поводу способности американских компаний и далее удерживать лидерство в сфере ИИ, а главное — доказало, что высокого быстродействия можно добиться…

86 viewsAnatoly Alekseev, 14:54

Aspiring Data Science

#metrics

https://www.youtube.com/watch?v=PeYQIyOyKB8

YouTube

Maria Khalusova: Machine Learning Model Evaluation Metrics | PyData LA 2019

www.pydata.org

PyData is an educational program of NumFOCUS, a 501(c)3 non-profit organization in the United States. PyData provides a forum for the international community of users and developers of data analysis tools to share ideas and learn from each…

99 viewsAnatoly Alekseev, 15:15

Aspiring Data Science

#news #calibration #teaser

В процессе написания небольшой статейки, мини-исследования о пользе посткалибрации бинарных классификаторов. По мере работы возникают всё новые вопросы, на которые хочется дать ответ 😅 Вначале был 1 датасет, 2 модели, 3 библиотеки, через день уже 5 моделей, еще через день добавился доп. датасет с "другим видом" мискалибрации (что, кстати, заметно изменило рейтинги), через день библиотек заюзанных в сравнении стало 7. Теперь вот хочется добавить к зоопарку и какую-то свою реализацию калибратора, а просто "шоб було".

94 viewsAnatoly Alekseev, edited 16:56

Aspiring Data Science

#nestedcv

https://www.youtube.com/watch?v=DuDtXtKNpZs

YouTube

Sergey Feldman: You Should Probably Be Doing Nested Cross-Validation | PyData Miami 2019

It is common to perform model selection while also attempting to estimate accuracy on a held-out set. The traditional solution is to split a data set into training, validation, and test subsets. On small datasets, however, this strategy suffers from high…

💯1

106 viewsAnatoly Alekseev, 17:49

About

Blog

Apps

Platform