Записки CPU designer'a – Telegram
Записки CPU designer'a
2.93K subscribers
195 photos
2 videos
5 files
292 links
Всем привет. Меня зовут Николай.
Работаю RTL design инженером, амбассадором в RISC-V International.
В свободное время пишу о магии процессоростроения и цифровом дизайне.
Download Telegram
Школа Синтеза: как войти в разработку аппаратного обеспечения ⌨️

Продолжаю рассказывать о бесплатных и открытых образовательных программах, и одна из них — уже многим известный проект "Школа Синтеза".

Одно из главных преимуществ Школы Синтеза — это бесплатный доступ к лекциям и заданиям, а так же возможность обсуждать задания, задавать вопросы в чате с преподавателями школы.

Единственное ограничение: если вы хотите обучаться в офлайн-кластерах, приоритет будет отдаваться действующим студентам, но всегда есть опция онлайн обучения.

Из нововведений этого года добавили базовый и продвинутый уровень. С блоком лекций можно ознакомиться на портале Истового Инженера.

Подать заявку на участие так же можно на портале Иствого Инженера.

Ознакомиться с записью лекций прошлых лет можно тут: YouTube.

🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥64👀32
Понедельник день тяжелый, притащил вам мем с профунктора 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁47👍6🔥41
Драфт спецификации для матричного расширения RISC-V архитектуры.

Zvmm Family of Integrated Matrix Extensions, Version 0.1

IME — обозначает, что инструкции для работы с матрицами переиспользуют векторный регистровый файл, и данное расширение зависит от наличия и конфигурации векторного расширения.

Из интересных особенностей:

1) Новые инструкции для load/store не введены, вместо этого используются существующие векторные инструкции, такие как vle. Это позволяет избежать необходимости в изменении LSU pipeline и упрощает работу с памятью.

2) Выбран подход умножение вектора на матрицу, а не матрицу на матрицу, для упрощения аппаратуры, и как было указано выше, чтобы не усложнять LSU pipeline имплементацией более эффективных инструкций загрузки-сохранения матриц, а так же чтобы не раздвувать вычислительное ядро умножителями и деревом редукции частичных произведений.
Насколько это упрощение ценно и необходимо - вопрос открытый.

3) Zvmm32a16bf — в этом подмножестве анонсирована поддержка BF16, что оптимально для задач машинного обучения. Однако пока что не представлена поддержка FP16, что может стать предметом обсуждения для будущих версий.

4) Zvmm32a8mxf - поддержка 8-битных OCP MX типов данных, но не описана логика по работе с shared exponent.

5) Bulk normalization. Один из методов для проектирования матричного умножителя с плавающей точкой — использование bulk normalization. Этот подход предполагает динамическое выравнивание операндов относительно максимальной экспоненты в наборе, что позволяет значительно сократить аппаратные ресурсы.
Другой подход это конвертация float-point операндов в fixed point представлении. Этот подход дает бóльшую точность, избавляет от необходимости ранней нормализации, но намного затратнее с точки зрения аппаратуры.

Описание fixed-point подхода можно найти в данной статье.

Напоминаю, что это только драфт и многое еще может измениться🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥5👀21
zvmm-20241020.pdf
534 KB
Family of Integrated Matrix
Extensions, Version 0.1
🔥2
RISC-V Announces Ratification of the RVA23 Profile Standard

Давайте сначала разберёмся, что же такое профили и зачем они нужны.

RISC-V — это модульная архитектура, и разработчик процессоров может выбирать набор расширений, которые он хочет реализовать помимо базового набора, который является обязательным. Это делает проектирование проще и гибче, но значительно усложняет работу программистов.

Чтобы найти баланс между гибкостью и предсказуемостью поведения программного обеспечения, были разработаны профили, которые включают основной набор инструкций (базовое расширение) плюс определённые расширения.

Недавно был ратифицирован профиль RVA23 (Application profile). Основные отличия от прошлогоднего профиля: обязательная поддержка векторного расширения и расширения гипервизора.

Подробнее про то как устроены RISC-V профили можно почитать в блоге у Николаса Бруни🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5
Валерий Шунков, разработчик аналоговых и силовых интегральных микросхем известный на хабре под ником amartology начал вести ламповый транзисторный телеграмм канал: t.me/parasiticresistance

strongly recommend ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎉5👀43👍1
Будничное напоминание для всех, кто забыл или не знал, что в SystemVerilog существуют два разных типа данных: int и integer, которые имеют разные определения. int — это 2-state (0, 1) тип данных, тогда как integer — это 4-state (0, 1, x, z) тип данных, что необходимо учитывать при верификации цифрового дизайна.
🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👀1812👍7🔥1
У компании Anlogic, оказывается, есть SoC с встроенным RISC-V ядром, может кого заинтересует.
Документация доступна после регистрации, так что пока что не изучил что же там за ядро используется.

Пока искал информацию о новом вендоре на Reddit'e наткнулся на подборку производителей FPGA.
Не уверен, насколько этот список актуален для 2024 года, но тоже приложу к посту:

http://www.xilinx.com/

http://www.altera.com/

https://www.latticesemi.com/

http://www.microsemi.com/

https://www.gowinsemi.com/en/

http://www.achronix.com/

https://www.quicklogic.com/

https://www.dialog-semiconductor.com/products/greenpak/low-power-low-cost-forgefpga

https://github.com/os-fpga
(у домена osfpgaточкаorg видимо просрочена оплата домена и теперь по поиску редиректит на стремный сайт, поэтому оставил ссылку на их github)

https://anlogic.com/en

https://github.com/AnlogicInfo

https://www.efinixinc.com/

https://colognechip.com/

https://pangomicro.com/en/

http://www.isilicontech.com/

http://www.agm-micro.com/
🔥7👍61🎉1
EPIC/VLIW
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32👍73
Крутой Community Highlight про чипы серии Tenstorrent Wormhole.

Так же в блоге corsix, где изначально и опубликованы посты про Wormhole, можно найти занимательные заметки по тематике computer science: программные tips and tricks при конвертации флотов или заметки про x86 macro-op fusion.
🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Forwarded from fpga_news
Tenstorrent Wormhole Series

Part 1: Physicalities
Part 2: Which disabled rows?
Part 3: NoC propagation delay
Part 4: A touch of Ethernet
Part 5: Taking apart T tiles
Part 6: Vector instruction set
Part 7: Bits of the MatMul

https://tenstorrent.com/vision/community-highlight-tenstorrent-wormhole-series-part-1-physicalities
👍65
Не так давно на канале обсуждали различные симуляторы для моделирования и оценки производительности процессорных архитектур, включая gem5.

Краткий обзор, что такое gem5 и зачем он нужен:

1. Позволяет моделировать и анализировать производительность различных процессорных архитектур.

2. Используется для быстрого тестирования идей без создания реального оборудования. Симулятор позволяет проверить гипотезы и предложения, прежде чем начинать процесс аппаратно-программного проектирования.

После краткой справки хочу поделиться с вами YouTube-каналом ARM Research и замечательной лекцией — Learning gem5: Modeling Cache Coherence with gem5.

В видео вы узнаете об истории создания gem5, а также о задачах и проблемах моделирования когерентного кэша 💾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11
mpsoc_2022_final_grasset.pdf
2.6 MB
Обзорная презентация Scalable Matrix Extension от ARM.

Наиболее занимательной является новая архитектурно видимая область памяти ZA tile storage, которая позволяет вычитывать данные как построчно, так и по столбцам, обеспечивая возможность динамического транспонирования матриц.

Больше деталей по работе с матричным расширением можно найти в SME Programmer’s Guide.
👍14🔥41
Hello SME
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.

Наиболее интересной частью ресурса является раздел Microbenchmarks.

Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.

Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.

Исходники бенчмарков - scalable-analyses/sme

Buen Finde! 🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2
Lattice Semiconductor рассматривает полное приобретение FPGA подразделения Altera у Intel.
Altera обошлась Intel в $17 млрд, но рыночная цена может быть ниже.

🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
👀33😁10👍5
Bringup-Bench — это набор тестов на языке C с открытым исходным кодом, предназначенных для упрощения тестирования новых процессоров, ускорителей, компиляторов и операционных систем.

Ключевые особенности:

1) Открытый исходный код: тесты представлены в виде исходного кода. Это позволяет собирать их под целевой процессор, что особенно полезно для baremetal-систем с произвольной Memory Map.
Когда мы обсуждали набор программных тестов от Tenstorrent, там как раз была проблема с зависимостями адресного пространства, т.к. инженеры Tenstorrent опубликовали .elf файлы и файлы дизасемблера, а не исходные коды программы.

2) Почти полное отсутствие системных зависимостей: требуется реализация всего 4 системных вызовов для работы всех тестов. Подробнее смотри раздел Minimal system dependencies.

Спасибо автору VLSI Hub за наводку ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍12
Записки CPU designer'a pinned «https://news.1rj.ru/str/cpu_design_chat — чат канала Записки CPU designer'a»
Сегодня немного отойдём от основной темы канала.

Более половины длинных англоязычных постов в LinkedIn создаются с помощью искусственного интеллекта


К такому выводу пришел AI detection стартап Originality.

За последний год всё больше и больше новостей так или иначе отсылают к Теория мёртвого интернета.

Ждём, когда боты будут сами писать посты, комментировать их и репостить.
Или уже дождались?

Ставь 💾, если ты бот 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
86😁7👍3
Принес вам блог от энтузиаста из Тулузы по работе с SoC Zynq —
https://0bab1.github.io/BRH/

Блог появился относительно недавно, материалов пока что немного, но задел кажется интересным.
Кажется, это уже стало моим хобби — собирать ламповые местечковые блоги на тему digital design и делиться ими с вами.

Buen Finde! 🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4👀32
GOWIN Semiconductor Introduces Educational EDA Version V1.9.10.03 with Mac OS Support

Теперь не только опенсорсорс тулами и Vivado (в случае девайса на базе Apple Silicon) через докер Mac OS может порадовать FPGA энтузиаста.

Китайский производитель FPGA GoWin добавил в свою проприетарную EDA поддержку Mac OS.

Интересно насколько это решение рабочее, если кто-то соберется тестировать - поделитесь впечатлениями потом в комментарях 😎

p.s. судя по комментариям из коробки ни у кого пока что ничего не завелось
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥3👍1