NEW BOT Телеграм, страница

#simulation #optimization

Интересная идея о том, как ускорять симуляции с помощью ML и тем самым помогать быстрой оптимизации. Действительно, почему бы и и нет! Сначала собираем входные параметры системы +итоги симуляций, а дальше симуляцию пробуем заменять быстрой ML моделью.

https://www.youtube.com/watch?v=ohGeGfUCV_A

YouTube

ML for Optimization Problems | Qingchen Wang | Kaggle Days

👍1

122 viewsAnatoly Alekseev, edited 04:59

Aspiring Data Science

#c #с++ #bufferoverflow #security

Отчёт ONCD подчёркивает, что около 70 % всех уязвимостей в системе безопасности, выявленных инженерами Microsoft в 2019 году и Google в 2020 году, были связаны именно с нарушениями безопасности памяти. Эта статистика ясно демонстрирует необходимость переосмысления подходов к разработке ПО в контексте нынешней стратегии кибербезопасности США.

В отчёте не только указывается на проблемы с C и C++, но и предлагается ряд альтернатив — языков программирования, признанных «безопасными для памяти». Среди рекомендованных Агентством национальной безопасности (NSA) языков находятся: Rust, Go, C#, Java, Swift, JavaScript и Ruby. Эти языки включают в себя механизмы, предотвращающие распространённые типы атак на память, тем самым повышая безопасность разрабатываемых систем.

https://3dnews.ru/1100993/beliy-dom-rekomendoval-otkazatsya-ot-c-i-c-v-polzu-bezopasnih-yazikov-programmirovaniya

3DNews - Daily Digital Digest

Офис национального директора по кибербезопасности (ONCD) Белого дома США призвал разработчиков отказаться от использования языков программирования C и C++ в разработке критически важного ПО. Этот совет основывается на опасениях, связанных с безопасностью…

127 viewsAnatoly Alekseev, 19:26

Aspiring Data Science

#music #spiritualfront

I’ve seen a thousand mornings,
I’ve lived a million nights.
I’ve walked within the shadows
Beneath the city lights.
I‘ve fought a thousand battles,
I’ve been in a hundred wars.
And I will always live on
Behind closed doors.

https://www.youtube.com/watch?v=JQa6jjR7qoI

YouTube

When the Sun Has Ceased to Shine

Provided to YouTube by Trisol

When the Sun Has Ceased to Shine · Spiritual Front

Namenlos

℗ Trisol Music Group

Released on: 2008-01-25

Composer: Thomas Rainer

Auto-generated by YouTube.

136 viewsAnatoly Alekseev, 14:52

Aspiring Data Science

#featureselection #diogenes

в модуле filters Диогена уже 3k строчек кода. хотя вроде идеи основные такие простые и элегантные.

117 viewsAnatoly Alekseev, 16:58

Aspiring Data Science

#featureengineering #featureselection #diogenes

n =100_000
a = np.random.rand(n)
b = np.random.rand(n)
c = np.random.rand(n)
d = np.random.rand(n)
e = np.random.rand(n)
f = np.random.rand(n)

y=a**2/b+f/5+np.log(c)*np.sin(d)

df = pd.DataFrame(
    {
        "a": a,
        "b": b,
        "c": c,  
        "d": d,
        "e": e,

    }
)

from mlframe.feature_selection.filters import MRMR

fs=MRMR(full_npermutations=10,baseline_npermutations=20,verbose=1,n_workers=1,parallel_kwargs=dict(temp_folder=r"R:\Temp"),)
fs.fit(X=df,y=y)

2024-03-02 05:39:17,484 - INFO - screen_predictors-line:1524 - Starting work with full_npermutations=10, min_nonzero_confidence=0.99000, max_failed=1
2024-03-02 05:39:49,214 - INFO - fit-line:2750 - MRMR selected 4 out of 5 features: [{'name': 'a', 'indices': (0,), 'gain': 0.33220730396336595, 'confidence': 1.0}, {'name': 'b', 'indices': (1,), 'gain': 0.5405325314273686, 'confidence': 1.0}, {'name': 'c', 'indices': (2,), 'gain': 0.20641517193369197, 'confidence': 1.0}, {'name': 'd', 'indices': (3,), 'gain': 0.07414164383695354, 'confidence': 1.0}]
2024-03-02 05:40:34,762 - INFO - fit-line:2983 - mul(log(c),sin(d)) is recommended to use as a new feature!
2024-03-02 05:42:12,619 - INFO - fit-line:2983 - mul(squared(a),reciproc(b)) is recommended to use as a new feature!
time: 3min 7s (started: 2024-03-02 05:39:05 +03:00)

Как тебе такое, Франциска Хорн? )

🔥3

141 viewsAnatoly Alekseev, edited 02:42

Aspiring Data Science

#featureengineering #featureselection #autofeat

from autofeat import AutoFeatRegressor

model = AutoFeatRegressor(transformations = ('1/', 'exp', 'log', 'sin', 'sqrt', '^2', '^3'),featsel_runs=15)

new_df = model.fit_transform(df, y)

time: 5min 23s (started: 2024-03-02 06:07:07 +03:00)

Эмм.. А можно мне другой отборщик признаков? )

142 viewsAnatoly Alekseev, 03:14

Aspiring Data Science

#astronomy #lifeorigin

https://www.youtube.com/watch?v=vgqfuOS0v9s

YouTube

Семихатов, Сурдин и Вибе ищут ЖИЗНЬ В КОСМОСЕ. Вселенная Плюс

Есть ли жизнь в космосе? Как её найти? И какой она будет? Спорят физик Алексей Семихатов, астроном Владимир Сурдин и астрохимик Дмитрий Вибе.
Записывайтесь на корпоративное обучение в Яндекс Практикуме: https://clck.ru/398vqg

Получи бесплатный Плюс Мульти…

142 viewsAnatoly Alekseev, 22:54

Aspiring Data Science

#reading

Читаю книжку, ловлю себя на мысли, что сноски внизу страницы должны кануть в небытиё (к чему эта саккада через всю страницу вниз-вверх? это сделано что, для моего мнимого удобства?). Как и чёртовы благодарности жёнам, детям, собакам автора. Равно как и "отзывы читателей", к примеру, в книжке Кохави, или как его, по А/Б тестам. Книжка была дрянной, а прекрасные "отзывы читателей" он расписал страницах на 5, не меньше.

👍1👎1

140 viewsAnatoly Alekseev, edited 23:35

Aspiring Data Science

#gametheory #prisonerdilemma

Как из игр возникает мораль

https://www.youtube.com/watch?v=o-lFK7nZIKE

YouTube

Теория игр: жизнь, Вселенная и всё остальное [Veritasium]

Поддержать проект можно по ссылкам:
Если вы в России: https://boosty.to/vertdider
Если вы не в России: https://www.patreon.com/VertDider

Дилемма заключённого — известная задача в теории игр. Самая выигрышная стратегия в ней — предательство. Но что если эту…

👍2

135 viewsAnatoly Alekseev, 20:09

Aspiring Data Science

#trading

Алготрейдинг - рай для интроверта )

https://www.youtube.com/watch?v=QRJ-0lrZagY

YouTube

Георгий Черемовский - Wunder Fund | подкаст Механики Бизнеса | # 92 | Управление HFT фондом

Выпуск создан при поддержке веб-студии RoundaboutVISION
https://roundaboutvision.com/

Георгий Черемовский - сооснователь фонда Wunder Fund, который занимается разработкой роботов для высокочастотной торговли на биржах.

Высокочастотная торговля (high-frequency…

164 viewsAnatoly Alekseev, 21:19

Aspiring Data Science

#featureengineering #featureselection #diogenes

Хорошие новости!

Как уже поняли читатели моего блога, в библиотеке отбора признаков Диоген появился также и модуль инженерии/конструирования новых признаков, но не бездумного, как в autofeat, а направленного, на основании теоретико-информационных метрик (в основном, взаимной информации MI комбинаций факторов с таргетом).

Основной мотивацией была попытка выделить рациональное зерно из набивших оскомину унылых рекомендаций и бубнежа вида "также иногда помогает логарифмирование, экспоненциирование, извлечение корней, попарное перемножение или деление исходных факторов". Эти рекомендации регулярно встречаются в курсах по FE и презентациях кэгглеров, но непонятно, как к этому вообще подступаться, кроме разве что каких-то случайных выпадов. Ну вот есть у меня 10k оригинальных признаков, мне взаимные отношения или произведения у каких именно из 50M пар проверять?

А так как метод MRMR в Диогене как раз и определяет достаточно хорошее в смысле предиктивности и уникальности подмножество признаков, некоторая проверка комбинаций становится уже реальной. Ещё больше пространство поиска сужает эвристика, что MI от "хорошей" на предмет тесной нелинейной связи пары признаков должна быть выше суммы индивидуальных MI факторов пары.

Это уже позволяет брать любые известные классы функций и для пары признаков a,b пытаться подбирать (в рамках бюджета) F3(F1(a),F2(b)) дающие максимальную MI с таргетом. В некоторых простых случаях этот метод срабатывает на ура, результаты я показывал выше. Но, если истинная зависимость сильно искажает вход ДО передачи в нелинейную функцию, метод становится практически бессилен и связь не обнаруживается.

Алексей @introspec предложил очень классную идею: почему бы не заменить подбор функций, сходимость которого дело скорее удачи, подбором коэффициентов ортогональных многочленов (например, Эрмитовых), теоретически умеющих аппроксимировать любую функциональную зависимость на отрезке? Взяв степень пониже, и коэффициенты поближе к 0, можно обеспечить своего рода регуляризацию.

Я попробовал пару дней тому заменить случайный поиск в пространстве функций на почти настолько же случайный поиск в пространстве коэффициентов Эрмитовых полиномов, но поставил вариацию на паузу из-за того, что не находились достаточно хорошие решения.

Теперь, собственно, к новостям )
Потестил свой модуль с разными исходными зависимостями, немного прояснил чувствительность и границы применимости метода. Пофиксил баги.

И... Заменил случайный перебор Эрмитовых полиномов на направленную оптимизацию с помощью Optuna )
Решения явно стали находиться получше за разумное время, иногда по качеству не уступают "нативным", когда зависимость известна. Нужно больше тестов. И, самое главное, предстоит выяснить, дают ли такие необычные преобразования реальные преимущества в ML метриках, или же ведут к оверфиту.

👍2🔥1

231 viewsAnatoly Alekseev, 04:04

Aspiring Data Science

#nvidia

"Новую неделю акции NVIDIA продолжили дальнейшим ростом от отметки в $2 трлн капитализации, которая была достигнута в конце прошлой недели. Укрепившись в цене на 3,61 % до $852,52 за штуку, акции компании сделали её третьей в мире по величине капитализации, позволив обойти в мировом рейтинге Saudi Aramco, чья капитализация опустилась до $2,01 трлн."

https://3dnews.ru/1101210/pri-kapitalizatsii-213-trln-kompaniya-nvidia-stala-tretey-v-mire-po-velichine

3DNews - Daily Digital Digest

При капитализации $2,13 трлн компания NVIDIA стала третьей в мире по величине

Новую неделю акции NVIDIA продолжили дальнейшим ростом от отметки в $2 трлн капитализации, которая была достигнута в конце прошлой недели.

134 viewsAnatoly Alekseev, 03:53

Aspiring Data Science

#chess #news

https://www.youtube.com/watch?v=P3phZqVOFkE

YouTube

Турнир претендентов 2024 (доедут не все)

Шахматная весна началась очень бодро: за последние несколько дней произошли серьезные изменения в лайв-рейтинге, продолжил свой "читерский рейд" Владимир Крамник, а Канада до сих пор не дала разрешение на въезд отдельным участникам турнира претендентов.
…

121 viewsAnatoly Alekseev, 06:14

Aspiring Data Science

#trading

https://www.youtube.com/watch?v=KluqUZhYvoc