NEW BOT Телеграм, страница

Aspiring Data Science

#hardware #cpu #zen5

Я не верю вот этому выводу:

"Расширение архитектуры Zen 5, проведённое на всей протяжённости исполнительного конвейера вместе с оптимизацией под SMT, улучшение предсказания переходов и полноценная поддержка AVX-512 кажутся довольно внушительными переменами. Однако проблема в том, что в десктопном воплощении Zen 5 все эти глубинные преобразования оказались фактически единственным проявлением прогресса. И это вполне может стать причиной, по которой заложенный в Ryzen 9000 теоретический потенциал окажется не столь заметен в повседневном использовании. Раньше вместе с совершенствованием архитектуры AMD уделяла внимание внедрению улучшений и на более высоких уровнях — в топологии процессоров, в поддержке ими более скоростной памяти, в возможностях SoC и платформы и проч. На этот же раз модернизация затронула одну лишь только внутреннюю архитектуру ядер и ничего больше."

Если действительно в Zen5 столько улучшений, какого хрена этого не видно в тестах?

"Блок предсказания переходов давал высокую точность и в архитектуре Zen 4, но в Zen 5 разработчики AMD нашли возможность сделать его ещё эффективнее. Достигнуто это не только существенным увеличением глубины таблиц истории переходов, но и путём отслеживания более длинных ветвей кода. В итоге ядро Zen 5 способно накапливать статистику по 24 тыс. адресов переходов, что примерно втрое превышает возможности Zen 4. Причём наряду с ростом доли правильно определённых ветвлений кода AMD смогла добиться и прибавки в скорости выдачи таких предсказаний до двух штук за такт.

Ещё один важный кирпичик в фундаменте общего повышения темпа работы конвейера в Zen 5 — ускоренная выборка инструкций. Фактически AMD перелопатила всю его входную часть, сделав её полностью двухпоточной. L1-кеш инструкций сохранил свой размер 32 Кбайт, но получил возможность обрабатывать две 32-байтных выборки каждый такт против одной такой выборки в Zen 4. Декодер инструкций при этом тоже стал двойным, и фактически это означает, что преобразование x86-инструкций во внутренние микрооперации теперь может происходить в два независимых потока. Вместо декодирования шести инструкций за такт, как это было в Zen 4, Zen 5 может декодировать по четыре инструкции дважды. В том же направлении изменился и кеш декодированных инструкций. Его объём стал чуть меньше — 6 тыс. записей (было 6,75 тыс.), но зато теперь он способен возвращать каждый такт по шесть инструкций два раза — отдельно для каждого потока. Довольно любопытно, что в этой части ядра AMD внесла комплекс изменений, явно предназначенный для повышения эффективности технологии SMT. И это решение диаметрально отличается от курса, взятого Intel, которая в своих свежих архитектурах планомерно отказывается от поддержки Hyper-Threading.

С учётом ориентации на SMT ширина архитектуры Zen 5 выросла по сравнению с Zen 4 на треть. Теоретически новые ядра AMD способны обрабатывать по восемь инструкций одновременно на всём протяжении исполнительного конвейера. И диспетчер, и блок отставки, завершающий исполнение микроопераций, рассчитаны именно на такой параллелизм, в то время как в Zen 4 эти же функциональные блоки были спроектированы под работу с шестью инструкциями одновременно. Расширение сопровождается увеличением размера буфера переупорядочивания (очереди отставки) с 320 до 448 инструкций и целочисленного регистрового файла с 224 до 240 записей, что также содействует наращиванию возможностей ядра процессора по параллельному исполнению инструкций.

Чтобы задержек не возникало при ожидании необходимых данных, которых для более широкого ядра очевидно требуется больше, разработчики Zen 5 увеличили объём кеш-памяти данных первого уровня с 32 до 48 Кбайт. Вместе с тем с 8 до 12 путей выросла ассоциативность этого кеша (и, соответственно, его эффективность), но латентность осталась на привычном уровне 4 такта."

87 viewsAnatoly Alekseev, edited 13:13

Aspiring Data Science

#hardware #cpu #zen5

"Что ещё интереснее, впервые со времён Zen 2 кеш первого уровня существенно нарастил пропускную способность. В Zen 5 он может отдавать четыре 64-байтных или принимать два 64-байтных блока за такт (против трёх и одного соответственно в Zen 4). Более того, в Zen 5 стал быстрее работать и кеш второго уровня. Его ёмкость сохранилась на уровне 1 Мбайт, но зато пропускная способность стала выше благодаря тому, что для соединения с L1-кешем стала использоваться вдвое более широкая 512-битная шина, через которую за такт можно прокачать 64 байта данных.

Но и это ещё не всё. Разработчики AMD нашли возможность немного поднять и производительность кеш-памяти третьего уровня. Её скорость в процессорах AMD ограничивается возможностями шины Infinity Fabric, которая в процессорах Ryzen среди прочего объединяет части L3-кеша, попадающие в разные CCD-чиплеты. Сама эта шина в Zen 5 не имеет никаких отличий от предыдущих реализаций, но обновлённый L3-кеш научился принимать и отдавать в одно ядро по 32 байт данных за такт — как раздельно, так и одновременно. В процессорах прошлого поколения достижение такой пропускной способности L3-кеша было возможно лишь при одновременной работе с ним нескольких ядер.

Все перечисленные улучшения в подсистеме кеширования Zen 5 сделаны ради того, чтобы минимизировать простои исполнительных блоков, ведь их число в новой версии архитектуры тоже выросло. Целочисленная часть в новом ядре насчитывает шесть арифметико-логических (ALU) и четыре адресных (AGU) устройства, а вещественночисленная — ещё шесть FP-устройств.

При этом интересным нововведением в исполнительном домене стал переход AMD к единому планировщику для всех целочисленных ALU-портов, хотя в прошлых архитектурах компания опиралась на набор отдельных планировщиков для каждого порта. Такая реализация сложнее, но должна быть эффективнее, поскольку все исполнительные устройства теперь получают инструкции из общей очереди. Дифференциация осталась лишь для AGU-портов, которые работают с собственным отдельным планировщиком.

Забавно, но блок Zen 5, отвечающий за работу с числами с плавающей точкой, устроен ровно противоположным образом. В нём применяется три равноправных планировщика, и это явное развитие прошлых идей — в Zen 4 таких планировщиков было два. Но FP-блок в Zen 5 претерпел кардинальные изменения в другом — его исполнительные устройства научились работе с 512-битными векторными регистрами, что означает полноценную поддержку исполнения AVX-512-кода. Теперь такие инструкции могут обрабатываться процессором за один приём, а не дробиться для отправки на исполнительные устройства на пару 256-битных команд. Благодаря этому ядра Zen 5 должны получить очень весомый прирост производительности в задачах, поддерживающих AVX-512 и VNNI-инструкции. Тем более что попутно AMD удалось улучшить исполнение некоторых операций с плавающей точкой: например, сложение в Zen 5 выполняется за два такта вместо трёх, которые требовались процессорам AMD ранее.

К тому же одним только изменением исполнительных устройств дело не ограничивается. AMD говорит о «сквозной» поддержке AVX-512 на низком уровне, а это означает ещё и то, что L1-кеш данных получил специальный механизм для работы с 512-битными векторами. Это выражается в том, что FP-блок Zen 5 научился при необходимости загружать оттуда сразу два 512-битных вектора за такт — вдвое больше, чем было возможно в Zen 4."

https://3dnews.ru/1110998/obzor-ryzen-7-9700x

3DNews - Daily Digital Digest

Обзор Ryzen 7 9700X: плохой процессор на хорошей архитектуре

Хотя в архитектуре Zen 5 заложен большой прирост IPC, десктопные процессоры на её основе получились почти не быстрее предшественников. На примере Ryzen 7 9700X разбираемся, как так вышло и что теперь с этим делать

90 viewsAnatoly Alekseev, edited 13:13

Aspiring Data Science

#mlops #clearml

https://www.youtube.com/watch?v=LlH9VRPV8ZQ

YouTube

Алиса Лаврентьева | Одиссея MLOps: Как мы ClearML в облако несли и не расплескали

Спикер: Алиса Лаврентьева, Lead MLOps Engineer Компания: Flocktory

Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции MLOps: https://ods.ai/tracks/df24-mlops
______
Наши соц.сети:
Telegram: https://news.1rj.ru/str/datafest…

109 viewsAnatoly Alekseev, 13:55

Aspiring Data Science

#ai #gpt #assitants

Команда Алисы, конечно, супер качественно делает свою работу. Приятно удивляют.

https://youtu.be/riaheepINKw?si=xJQZ7fZ58WrR7AXi

YouTube

Алиса. Как измерить умность голосового ассистента – Анастасия Беззубцева

Присоединяйтесь к нашему чату https://news.1rj.ru/str/YandexDataDriven

Сайт конференции https://events.yandex.ru/events/data-driven-2022

Алиса — это виртуальный помощник и друг, каждый месяц она помогает более 45 миллионам человек решать бытовые задачи и просто весело…

110 viewsAnatoly Alekseev, edited 19:12

Aspiring Data Science

#stats #distributions #lognormal

Введение в подгонку распределений. Почему выбросы логнормального распределения так сильно удалены друг от друга?

youtube.com/watch?v=44D1bd7tQ4w

YouTube

Allen Downey - Extremes, outliers, and GOATS: on life in a lognormal world | PyData Global 2023

www.pydata.org

The fastest runners are much faster than we expect from a Gaussian distribution, and the best chess players are much better. In almost every field of human endeavor, there are outliers who stand out even among the most talented people in the…

95 viewsAnatoly Alekseev, 14:05

Aspiring Data Science

#survival

https://www.youtube.com/watch?v=gke0hNQMdT8

YouTube

Olivier Grisel - Predictive survival analysis with scikit-learn, scikit-survival and lifelines

www.pydata.org

This tutorial will introduce how to train machine learning models for time-to-event prediction tasks (health care, predictive maintenance, marketing, insurance...) without introducing a bias from censored training (and evaluation) data.

PyData…

97 viewsAnatoly Alekseev, 14:47

Aspiring Data Science

Forwarded from asisakov

Статзначимость коэффициентов при регрессии

Вчера спорили с ребятами на работе по поводу статзначимости и как ее считать. После вопроса про оценку значимости коэффициента я ожидал услышать что-то типа бутстрапирования выборки.

Однако, ребята вспомнили интересную формулу из книжки по эконометрике (Jeffrey M. Wooldridge. Introductory Econometrics. A modern approach). Вот та самая формула ниже:

Var(beta_j) = sigma^2 / (SST_j * (1 - R_j^2 )) - уравнение для оценки дисперсии признака j

sigma^2 - дисперсия ошибки

SST_j = sum((x_ij - mean(x_j))^2) - суммарная дисперсия выборки по признаку j

R_j^2 - оценка R^2 от оценки регрессии этого признака j на остальных

При помощи нее мы оениваем дисперсию, и затем можем поглядеть, попадает ли 0 в доверительный интервал, и насколько узок или широк этот самый доверительный интервал.

Но самое интересное еще впереди. Что меня уже зацепило, так это формулировка одной из переменных данной формулы: оценка R^2 от оценки регрессии этого признака j на остальных. Что-то напоминает?

Действительно, это оказался тот самый VIF. Если мы спустимся от этой формулы (в книжке это формула 3.51 на странице 94) ниже на 4 страницы, мы реально увидим переход к этой формулировке:

Var(beta_j) = (sigma^2 / SST_j) * VIF_j

К чему это я: За счет отбора признаков по VIF перед обучением регрессии на них, мы можем добиться повышенной вероятности того, что все наши признаки будут статзначимы для модели. Вот такое небольшое наблюдение.

#ml #statistics

👍1

87 viewsAnatoly Alekseev, 19:59

Aspiring Data Science

#matching #soundex

https://www.youtube.com/watch?v=UXSYaxuU7Kw

YouTube

Андрей Мирошников | Shazam для ФИО: как найти match, если имя можно написать 20 разными способами

Спикер: Андрей Мирошников

Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции NLP: https://ods.ai/tracks/df24-nlp
______
Наши соц.сети:
Telegram: https://news.1rj.ru/str/datafest
Вконтакте: https://vk.com/datafest…

105 viewsAnatoly Alekseev, 20:29

Aspiring Data Science

#trading #gpt #timegpt

https://www.youtube.com/watch?v=n3o6Q_R6UYA

YouTube

Miquel Noguer i Alonso (Artificial Intelligence Finance Institute): "LLM in Quantitative Finance"

Abstract
We will explore 3 user cases LLMs for Algorithmic Trading , as a Financial Analyst and LLM time series:
1. LLMs in Algorithmic Trading: Enhance strategies by analyzing market data, predicting trends, and automating real-time trading decisions for…

126 viewsAnatoly Alekseev, edited 23:08

Aspiring Data Science

#dask

https://www.youtube.com/watch?v=h1KwAkqo3kY

YouTube

Dask Case Study | Dask In The Wild: How Customers Use Dask | Gus Cavanaugh

Learn more at https://bit.ly/3zCnqT2

Why are companies like Capital One, Barclays, and Two Sigma using Dask?

In this webinar, Gus Cavanaugh from Coiled will share stories and examples from Dask users in Finance, Life Sciences, and Energy. Gus will illustrate…

100 viewsAnatoly Alekseev, 03:38

Aspiring Data Science

#ipywidgets

https://www.youtube.com/watch?v=1ndo6C1KWjI

YouTube

Bringing ipywidgets Support to plotly.py | SciPy 2018 | Jon Mease

We describe our efforts to bring full ipywidgets support to the plotly.py data visualization library. This work brings many exciting new features to Jupyter Notebook users working with plotly.py including Python callbacks, in-place figure updates, binary…

105 viewsAnatoly Alekseev, 03:42

Aspiring Data Science

#gpt #physics

Так и модель 4о не так плоха в решении задач, оказывается.

https://www.youtube.com/watch?v=m6nZ9h7S7nw

97 viewsAnatoly Alekseev, 15:59

Aspiring Data Science

#games #ants

Любителям муравьёв игрушка зайдёт )

https://youtu.be/dc0QGGlZfW0

YouTube

Empire Of The Ants NEW Gameplay Demo 4K (New Photorealistic Ant Simulator Game 2024)

Empire Of The Ants Gameplay Demo 4K NEW (No Commentary)

Experience an immersive journey and defend your lands through tactical and strategic battles in a microscopic world of epic proportions.
Exploration, strategy, combat skills, and alliances with local…

104 viewsAnatoly Alekseev, 19:55

Aspiring Data Science

https://www.youtube.com/watch?v=0F8_B9nI4vo

YouTube

Варя Новожилова | End2End. О чем важно подумать, если вы хотите увидеть свою работу в проде.

Спикер: Варя Новожилова, Head of RnD, Skyeng

Тема доклада: End2End. О чем важно подумать, если вы хотите однажды увидеть свою работу в проде. (Кейсы проблема-варианты решения).

Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы…

118 viewsAnatoly Alekseev, 19:58

Aspiring Data Science

#gpt #timeseries

https://www.youtube.com/watch?v=2Z2KE7jTnYs

YouTube

Мартин Габдушев | Foundation модели: есть ли жизнь во временных рядах

Спикер: Мартин Габдушев, ML разработчик ETNA

Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке секции Time Series: https://ods.ai/tracks/df24-time-series
______
Наши соц.сети:
Telegram: https://news.1rj.ru/str/datafest…

143 viewsAnatoly Alekseev, 05:43

Aspiring Data Science

#skipthis

Пополнился мой список вещей, которые не должны существовать:

1) благодарности в книге
2) сноски в книге или статье
3) фраза "withouth further ado"

😁3

131 viewsAnatoly Alekseev, edited 20:42

Aspiring Data Science

#intel

Sic transit gloria mundi.

https://3dnews.ru/1111319/the-wall-street-journal-qualcomm-obratilas-k-intel-s-predlogeniem-eyo-kupit

3DNews - Daily Digital Digest

Qualcomm предложила купить Intel целиком, но состоится ли «сделка века», пока неизвестно

Компания Qualcomm на днях обратилась к Intel с предложением её купить, пишет издание The Wall Street Journal, ссылаясь на источники, близкие к этому вопросу. В начале этого месяца сообщалось, что Qualcomm рассматривает возможность покупки части бизнеса Intel…

134 viewsAnatoly Alekseev, 05:21

Aspiring Data Science

#astronomy

Маск подгадил астрономам.

https://3dnews.ru/1111269/sputnikovaya-set-starlink-ilona-maska-blokiruet-obzor-vselennoy-zayavili-uchyonie

3DNews - Daily Digital Digest

Астрономы в панике: свежие спутники Starlink создают в 32 раза больше помех радиотелескопам, чем старые