Записки CPU designer'a – Telegram
Записки CPU designer'a
2.93K subscribers
195 photos
2 videos
5 files
292 links
Всем привет. Меня зовут Николай.
Работаю RTL design инженером, амбассадором в RISC-V International.
В свободное время пишу о магии процессоростроения и цифровом дизайне.
Download Telegram
Понедельник день тяжелый. Поэтому меньше слов, больше картинок☺️

Принес вам floorplan нового мобильного процессора AMD Strix Point.
Процессор изготовлен на базе техпроцесса TSMC N4P.

На floorplan'e можно оценить площадь NPU на базе архитектуры XDNA 2, относительно ядер Zen5.

Краткий обзор XDNA 2 NPU можно посмотреть на AnandTech.
В обзоре также упоминаются блочные флоты, обратите на них внимание.
О Microscaling форматах мы с вами поговорим позже.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥121
На портале chipsandcheese три дня назад вышел детальный разбор AMD’s Strix Point. Так что если ищите лонг-лонг рид про новый чип от AMD, добро пожаловать☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍62
Вернемся к теме матричных расширений 👀

Не так давно я делился с вами выступлением Валерии Пузиковой с обзором архитектур матричных расширений.

На портале Истовый Инженер, теперь можно ознакомиться с этим докладом в текстовом формате, а так же с подробным разбором AME расширения от T-head и обзором работы SiG ( special interest groups) по разработке новых матричных расширений для архитектуры RISC-V.

Ниже приведены ссылки на эти материалы:

1) Панорама матричных расширений: от x86 до RISC-V
(расширенная, текстовая версия доклада с Митапа RISC-V Альянса)
2) Заглянем в хрустальный шар: как продвигается разработка стандартных матричных расширений RISC-V (обзор работы рабочих групп по разработке интегрированного матричного расширения [IME] и независимого матричного расширения [AME])
3) Погружение в матрицу: расширение RISC-V от T-Head (обзор открытого AME-расширения от T-Head)
4) Математика матричных расширений: умножение матриц на примере T-Head Matrix Extension (разбор матричного умножения на программном уровне с использованием расширения от T-Head)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍193😁31
Вышел новый микроконтроллер от Raspberry Pi - RP2350.

Подробнее с характеристиками микроконтроллера можете ознакомиться на странице продукта.

На канале подготовлю несколько небольших постов про новый чип, но сегодня остановимся на главной особенности микроконтроллера.
С RP2350 вы сможете работать и как с ARM-контроллером на базе ядер Cortex-M33, так и с RISC-V решением на базе IP-core с открытым кодом Hazard3.
Работать можно либо с двумя ядрами на базе RISC-V, либо с ARM ядрами.

Также стоит отметить, что RP2350 поддерживает возможность работы в смешанных комбинациях архитектур, где одно ядро может быть Arm, а другое — RISC-V. Однако это требует использования двух отдельных программных образов, и хотя аппаратные средства поддерживают такую конфигурацию, практическое применение может быть ограничено.
Подробнее про это можно прочитать в разделе 3.9.2 RP2350 Datasheet.

Вот выдержка из документации на микроконтроллер:

Architecture Switching

RP2350 includes a pair of open-hardware Hazard3 RISC-V cores which can be substituted at boot time for the Cortex-M33 cores. Our boot ROM can even auto-detect the architecture for which a second-stage binary has been built and reboot the chip into the appropriate mode. All features of the chip, apart from a handful of security features, and the double-precision floating-point accelerator, are available in RISC-V mode.


Так же Raspberry Pi выпустили devboard на базе данного контроллера с рекомендованной стоимостью 5$. Изображение платы можно увидеть в шапке поста. Вопрос к плате только 1 — micro-usb в 2024? Серьёзно?💀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥105👍3🤡3🗿1
Chip Annotation Viewer

Год назад я писал про профиль на фото-хостинге Flickr, где автор выкладывает отличные фотографии микросхем (die shots).

Сегодня я нашел интересный ресурс, на котором собраны die shots различных энтузиастов. Для некоторых процессоров даже добавлены разметки floor-plan'a.
Например, вот ссылка на ядро i5-2500 на базе микроархитектуры Sandy Bridge от Intel.

Фильтр включается в поле рядом с названием модели чипа, а регулировать масштаб лучше специальными кнопками в левом нижнем углу экрана, а не колесиком мыши☺️

#dieshots
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍7👀42
Понедельник день тяжелый, продолжаю соблюдать принцип меньше букв - больше картинок.

Принес вам подборку девбордов на базе RP2350, которую обсуждали с вами на прошлой неделе.

1) Подборка плат в онлайн-сторе Pimoroni;
2) development board от sparkfun;
3) development board от ilabs;
4) development board от Seeed Studio;
☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1122😁1
Принес вам классную статью с портала semianalysis: Groq Inference Tokenomics: Speed, But At What Cost?

В статье обсуждается производительность программно-аппаратного комплекса от Groq при работе с моделью Mixtral 8x7b. Обратите внимание, что на первом же графике указывается соотношение USD на 1 миллион токенов. Числа для топсов/флопсов придержите для рекламы и продакт брифов.

Интересен Groq в первую очередь с архитектурной точки зрения. Это VLIW машина, без внешний памяти, блоков типа предсказателя переходов, префетчеров, контроллера кэшей, а вся модель размещается на кластере, состоящей из Groq чипов.
В данной статье описывается, что для работы с моделью Mixtral потребовалось подключить 576-чипов, каждый из чипов обладает на кристальной SRAM памятью в 230 MB!

Фактически DSP-core AI/ML ускоритель от Groq — это классическая числодробилка. Блоки умножения матриц, как ни странно - для умножения матриц, VectorUnit для вычислений посложнее, например, обсчет активационных функций (sigmoid, softmax, и.т.п), а между модулями матричной и векторной обработки расположены блоки SRAM памяти.

Больше чисел, графиков и ссылок найдете в вышеуказанной статье
👍14🔥432
Продолжая тему чипа от Groq настоятельно рекомендую ознакомиться с докладом Andrew Bitar'a, Principal Compiler Engineer в компании Groq:
Groq’s Software-Defined Hardware for Dataflow Compute

Это доклад посвящен современным вызовам и решениям в области вычислительных архитектур. С окончанием закона Деннарда и ростом вычислений, связанных с обработкой больших массивов данных, особенно в области AI/ML ускорителей и высокопроизводительных вычислений, возрождается тренд на проектирование чипов на базе Domain-specific architecture.

В докладе рассказывается о концепции Software-Defined Hardware на примере архитектуры Groq.
Этот подход позволяет упростить управление вычислительными ресурсами, устраняя необходимость в аппаратном контроле за потоками данных, что в свою очередь значительно упрощает микроархитектуру конечного чипа. Важность такого подхода заключается в том, что он делает работу с данными более предсказуемыми и эффективными, что особенно критично в эпоху замедления закона Мура и роста требований к производительности в задачах AI/ML ускорителей.

В качестве дополнительной литературы автор доклада рекомендует ознакомиться со следующими статьями:

1) A Software-defined Tensor Streaming Multiprocessor forLarge-scale Machine Learning

2) Think Fast: A Tensor Streaming Processor (TSP)for Accelerating Deep Learning Workloads
👍175👀4
Редакция канала Истовый Инженер поделилась замечательным ресурсом — Silicon Zoo, где собраны чип-арты, оставленные разработчиками микросхем.

На портале Silicon Zoo собраны самые разные чип арты, созданные разработчиками микросхем.
Эти рисунки создаются дизайнерами на свободных участках чипа и могут включать в себя как простые инициалы, так и сложные изображения, которые можно увидеть только под микроскопом. Такие изображения можно сравнить с аппаратной версией пасхальных яиц в программном обеспечении.

А в этом разделе, можете почувствовать себя в роли silicon art хантера и отыскать кремниевую creature на предложенном dieshot.

Chip Art из шапки поста — AMD Athlon K7 Pluto.

#dieshots
👍18🔥4👀41
Понедельник день тяжелый — никаких лонгридов, только мемы.
Мне дико зашел шаблон Triangle Factory.
Принес вам интерпретацию мема про Texas Instruments.
😁166👍2🔥2
13000 тестов для проверки процессоров на базе RISC-V ISA от Tenstorrent

Компания Tenstorrent продолжает вносить свой вклад в экосистему открытого исходного кода RISC-V. На GitHub представлено более 13 000 программных тестов, охватывающих широкий спектр RISC-V ISA, включая RV64-I, RV-M, RV-F, RV-D, RV-C, RV-V и другие.

Для RISC-V Vector поддерживаются две конфигурации для 128 и 256 битной длины векторного регистра.

Важно отметить, что несмотря на то, что тесты являются микроархитектурно-нейтральными и могут работать на популярных симуляторах RISC-V, таких как Whisper и Spike, успешный запуск этих тестов на конечной аппаратуре зависит от соответствия с memory map, проверяемого устройства.
Если карта памяти проверяемого устройства отличается от той, что используется в тестах, это может помешать их корректному запуску.
В репозитории можно найти только .elf файлы и файлы дизасемблера, которые и так можно получить из .elf файла.
В таком случае может потребоваться адаптация или перекомпиляция тестов в соответствии с картой памяти тестируемого устройства, а местами возможно и ручное обновления адресов, что кратно усложняет задачу по использованию данного тестового окружения.

Почему Tenstorent не предоставили исходники, который каждый может собрать под себя остаётся вопросом🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍137🔥3👀1
Год назад я писал про AI-ускорители от SAPEON 220-й серии. Чипы выпускались по устаревшему 28-нм техпроцессу, но при этом 220-я серия позиционировалась как прямой конкурент Nvidia A2. Среди особенностей - ускорители работали только с целочисленными форматами данных int16/8/4.

Недавно SAPEON анонсировала 330-ю серию. Основные обновления: 7-нм техпроцесс, добавлена поддержка FP16/8. В 330-й серии наблюдается четырёхкратный прирост производительности по сравнению с 220-й при работе с моделью Resnet-50 v1.5.

Больше подробностей смотрите на сайте компании и в product brief🖥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8👀43
RARS - RISC-V Assembler and Runtime Simulator

Многие старожилы моего канала и энтузиасты RISC-V знакомы с академическим симулятором RARS. Когда я учился в университете и читал первое издание книги Харриса и Харриса, я активно пользовался MIPS-версией симулятора MARS.

RARS — это программа для написания, сборки и симуляции выполнения программ на языке ассемблера для архитектуры RISC-V. Основная цель RARS — предоставить удобную и простую в использовании среду разработки для тех, кто только начинает изучать RISC-V.

Грустно наблюдать, но в последний год не видно никаких новых коммитов и исправлений, а десятки issues остаются открытыми.

Преподавательский состав из Университета Квебека в Монреале использует данный симулятор в своём курсе INF2171. Однако, поскольку поддержка RARS фактически остановилась, и у авторов не получается внести свои изменения в основной репозиторий, поэтому они продолжают исправлять проблемы RARS и добавлять новый функционал в собственной версии — RARSM.

Рекомендую обратить внимание на этот форк, так как он является поддерживаемой веткой RARS. В README можно ознакомиться со списком обновлений, исправлений в RARSM версии.
👍19🔥6👀2
AMD ограничивает проект ZLUDA по запуску CUDA-приложений на своих ускорителях

Open Source проект ZLUDA изначально был создан для нативного запуска CUDA-приложений на GPU Intel, но позже автор проекта, Анджей Яник, начал сотрудничество с AMD для создания аналогичного инструмента для "красных" GPU.
В 2022 году разработка проекта для AMD велась в закрытом формате, но в 2024 году, после прекращения финансирования со стороны AMD и по взаимному соглашению, проект вновь стал доступен в открытом доступе.

Однако позже AMD изменила своё решение и потребовала удалить код, несмотря на ранее данное разрешение на публикацию. AMD утверждала, что предыдущее согласие, данное по электронной почте, не имеет юридической силы. Интересно, что это требование исходило от AMD, а не от NVIDIA, хотя проект ZLUDA мог потенциально нарушать условия использования CUDA, установленные NVIDIA.

С проектом ZLUDA можно ознакомиться на GitHub-странице проекта.

Buen finde!☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍107😁31
Понедельник день тяжелый. Только мемы, ничего лишнего😠
Please open Telegram to view this post
VIEW IN TELEGRAM
😁65👍61
Завершилась конференция HotChips 2024 — одно из самых значимых и увлекательных ежегодных событий, посвященных передовым разработкам в области микропроцессоров и полупроводниковых технологий.

С программой конференции можно ознакомиться на сайте HotChips. Тут найдете и доклады от Nvidia, Intel, Qualcomm, AMD, OpenAI.
Но чтобы получить доступ к докладам и видеозаписям конференции придется раскошелиться на примерно на 130 долларов.

Если делать этого не хотите, то можно обратиться к изданиям, которые уже вовсю пишут статьи по прошедшим докладам. Один из таких сайтов — горячо мною любимый ChiP and Chease.

На момент публикации поста на портале уже доступны 3 доклада с прошедшей конференции:

1) AmpereOne at Hot Chips 2024: Maximizing Density. Особый интерес в том, что в докладе рассматриваются особенности архитектуры процессора от Ampere, включая детали разработки собственного ядра и отказа от лицензирования ядер Neoverse от Arm.

2) Hot Chips 2024: Qualcomm’s Oryon Core. Разбор микроархитектуры Snapdragon X Elite. Обсуждение предсказателя переходов TAGE, работы с памятью, особенности проектирования крупных TLB.

3) Tesla’s TTPoE at Hot Chips 2024: Replacing TCP for Low Latency Applications. Доклад посвящен суперкомпьютеру Dojo от Tesla и разбора проблемы ограничения пропускной способности из-за медленной передачи данных между хостами и суперкомпьютером через PCIe.

Вы еще тут? Бегом читать доклады, а потом обсудим их в комментариях 🤓
👍13🔥5👀2
Очередной стартап вышел из стелс режима. Встречайте - Akeana.

Akeana представила три семейства процессорных IP на базе RISC-V:

1) Akeana 100 Series: 32-битные решения микроконтроллерного класса.
2) Akeana 1000 Series: 64-битные процессоры с поддержкой многоядерности, векторных расширений, гипервизора и неких опциональных AI расширений. Ну куда же без них в 2024-м.
3) Akeana 5000 Series: Высокопроизводительные 64-битные процессоры для ноутбуков, дата-центров и облачных инфраструктур.

Кроме процессоров, Akeana также представила набор IP для создания SoC, который включает контроллеры прерываний (AIA RISC-V APLIC) и когерентные кластеры. Кроме того, компания анонсировала Matrix Engine, о котором пока доступно очень мало информации.

Более подробную информацию о характеристиках продуктов можно найти на сайте компании. Однако отсутствие реальных бенчмарков и возможности тестирования предлагаемого продукта — затрудняет оценку нового игрока в экосистеме RISC-V на данный момент.
👀11🔥6👍443
Введение в работу с EDA Vivado

Лектор Школы Синтеза Дмитрий Смехов подготовил прекрасное руководство по работе с инструментом Vivado, который используется при разработке аппаратуры для ПЛИС фирмы Xilinx (AMD).

Это руководство содержит рекомендации по организации репозитория проекта, запуска моделирования как в CLI, так и в GUI режимах.

Версия руководства на русском языке — link
Версия руководства на английском языке — link

#bestpractice
🔥25👍92👀2
Это вам за то, что шутите про a*x + b

Please open Telegram to view this post
VIEW IN TELEGRAM
😁27👀8🔥5
Не уходя далеко от темы Vivado, хочу напомнить, что в одном из лучших курсов по процессорным архитектурам есть руководство, которое помогает новичкам освоить основы работы с Vivado.

Если объём материалов курса АПС кажется пугающим и вы не знаете, с чего лучше начать, почему бы не начать знакомство со средой проектирования Vivado?

В руководстве разобраны следующие темы:

1) Создание нового проекта под отладочный стенд Nexys A7;
2) Навигатор по маршруту проектирования;
3) Менеджер проекта;
4) Как запустить симуляцию в Vivado;
5) Руководство по поиску функциональных ошибок;
6) Анализ RTL;
7) Как прошить ПЛИС;
8) Руководство по работе с ошибками обработки кода.

#bestpractice
👍14👀5🔥4
Новая книга от авторов «Цифровая схемотехника и архитектура компьютера»

На сайте издательства Elsevier появилась страничка книги RISC-V Microprocessor System-On-Chip Design.
В авторах указаны хорошо знакомые нам Харрис и Харрис.
Кстати, знали ли вы, что они не муж и жена, а просто однофамильцы?

На данный момент книга не имеет цены и возможности предзаказа, но уже сейчас можно ознакомиться с оглавлением во вкладке «Table Of Contents».
🔥54