Записки CPU designer'a – Telegram
Записки CPU designer'a
2.93K subscribers
195 photos
2 videos
5 files
292 links
Всем привет. Меня зовут Николай.
Работаю RTL design инженером, амбассадором в RISC-V International.
В свободное время пишу о магии процессоростроения и цифровом дизайне.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
DOOM 🔫

На недавно прошедшем европейском RISC-V Summit компания Semidynamics продемонстрировала преимущества векторизации на примере запуска DOOM на FPGA с софт-процессором Atrevido.

Теперь вы можете найти версию fbDOOM, адаптированную под векторное расширение RISC-V на github'e Semidynamics

Например, по этой ссылке можно посмотреть, как выглядит векторизация функции отрисовки текстур.

На представленном видео показаны два видеоряда, генерируемых на FPGA с тактовой частотой 25MHz. Видно разницу между работой OoO ядра Atrevido с подключенным векторным сопроцессором и без него. Разницу в приросте FPS можно увидеть на видео в начале поста или посмотреть демонстрацию с комментариями от директора Semidynamics на YouTube.

Для удобства счётчик FPS аппроксимирован к частоте реального процессора, а не прототипа на базе FPGA.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍3🎉1
Презентации с конференции HotChips 2023

Конференция HotChips завершилась в воскресенье, и уже сегодня в интернете появились доклады с этого мероприятия.

Мой список must see:

1) SiFive P870 RISC-V: Одной из самых заметных новинок стал анонс ядра серверного класса SiFive P870 RISC-V. Особое внимание привлекла поддержка OoO VPU, и имплементация выполненная в виде двух независимых векторных конвейеров. Особенно впечатляет глубина ROB, составляющая 1120 инструкций.
Для сравнения, у 3-летнего Apple M1 эта глубина была около 630 инструкций.
До момента релиза SiFive P870 только компания Semidynamics предлагала OoO VPU на рынке IP-core. Для application задач в SiFive решили использовать вектора длиной 128 бит. Так же стоит отметить, что эти конвейеры не симметричные. Операции деления и permutation отведены одному конвейеру, а задачи маскирования другому. В остальном конвейеры идентичны, оба имеют блоки обработки криптографических инструкций.

Однако, не все идут по этому пути. Например, BSC для HPC-задач активно продвигает идею использования сверхдлинных векторов размером 16Кbit!!! Подробнее аспекты и детали VPU от BSC смотри в статье про Vitruvius+.
Это показывает, как одно и то же ISA расширение может быть адаптировано под разные задачи.

2) Презентация Arm Neoverse V2: Этот доклад также вызвал большой интерес. В нем проводилось сравнение с первым поколением Neoverse. Напомню, что NVIDIA относительно недавно выпустила CPU (не GPU), на базе Neoverse V2. Судя по всему получилось у них очень неплохо.
NVIDIA Grace демонстрирует прирост производительности до 2,5 раз и увеличение эффективности в 3,5 раза в сравнении с AMD EPYC Milan. В проекте европейского импортозамещение EPI, так же используют ARM Neoverse, но первого поколения.

Больше докладов с прошедшей конференции HotChip можно найти тут.
🔥14👍7🍌1
Сhips And Cheese или hidden gem в мире новостей о полупроводниках.

Нашел Записки CPU designer'a здорового человека крутой ресурс и спешу с вами им поделиться.

В современном интернете много ютуб-каналов и новостных агрегаторов, засоренных кликбейтными новостями или преувеличенной значимостью событий.
Например, недавно все бурно обсуждали новость о банкротстве компании Байкал, хотя речь шла о компании Т-платформы.

Сложившаяся тенденция современной журналистики сподвигло энтузиастов создать ресурс, который бы предоставлял актуальные новости, утечки, обзоры и анализ технологий без преувеличений, с подтвержденными/официальными источниками информации.
Основная цель ресурса — обеспечивать читателям надежную, проверенную и прозрачную информацию, подлинность которой можно легко проверить по официальным анонсам.

Сайт открылся не так давно, судя по датам публикаций, первая была представлена в Декабря 2020-го.

На момент написания поста успел прочитать буквально две статьи.
Что меня приятно удивило, в статье FP Scheduler Layout, неожиданно для себя нашел линк на крутые Ph.D тезисы по имплементации Superscalar Out-of-Order x86 soft-core на FPGA. Теперь нужно видимо прочитать всю диссертацию, чтобы понять как аспирант получил лицензию на имплементацию x86 soft-core и поддержку какого множества из ISA х86 автор работы реализовал (так что ли можно было🤔).

Хотите обзор китайского Loongson? Пожалуйста. Отечественных процессоров в коллекции статей не нашел.

"Chips And Cheese" представляется перспективным ресурсом для всех, кто ищет объективную и актуальную информацию в области полупроводников. В эпоху информационного шума и многочисленных кликбейтных заголовков такие ресурсы становятся настоящей отдушиной и островком спасения для профессионалов и энтузиастов индустрии🎩
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥53
Для эффективной работы с арифметикой с плавающей точкой полезно иметь инструменты, позволяющие конвертировать числа из шестнадцатеричного формата IEEE-754 в экспоненциальную запись и обратно. Такие конвертеры так же помогают лучше понять суть fp-арифметики, а так же здорово помогают при подготовки лекций и презентаций. Вот подборка таких конвертеров и инструментов для визуализации чисел в формате IEEE-754 [и чуточку Posit, конечно🎩]:

1. FloatConverter: Отличный инструмент для работы с форматом типом данных float32. Здесь наглядна показана кодировка IEEE-754, а так же эффекты изменения шага мантиссы при увеличении экспоненты.
2. Float to Hex: Удобный инструмент для преобразования hex в десятичную запись дробных чисел и обратно для 32/64-битных представлений IEEE-754.
3. FloatInfo: Новый инструмент, который предлагает вывод формулы, представление результата в рациональной записи и поддержку многих форматов, включая IEEE-754 64/32/16, bfloat16 и posit64/32/16/8.
4. Exploring Binary: Этот инструмент поддерживает 32/64-битные представления IEEE-754. Особенностью является широкий спектр представлений исследуемого числа, включая различные формы научной записи.
5. IEEE-754 visualization: удобный инструмент для визуализации представления числа в формате IEEE-754, особенно полезный на этапах изучения работы формата.
6. Half-Precision Visualization: в данной статье о формате fp16 на числовом графике можно изучить распределение значений half-precision арифметики.

Также, вам может быть полезен этот курс по арифметике с плавающей точкой на YouTube.

И в завершении поста рекомендую ознакомиться с размышлениями Jeff Johnson'a в 2018-м году о адаптации float point математики для AI приложений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍10🍌1
Media is too big
VIEW IN TELEGRAM
На китайский видеохостинг выложили записи докладов с RISC-V Summit China 2023.

Если вы ждали запись выступления Александра Редькина, CEO Syntacore, на тему "Is RISC-V ready for the application class workloads?", можете посмотреть доклад по этой ссылке или в видео, прикрепленном к этому посту.

Спасибо русскоязычному комьюнити RISC-V за оперативную публикацию актуальных новостей.
Всем кто следит за развитием RISC-V и ищет сообщество единомышленников рекомендую подписаться на коллег.
👍262
It's literally me! 🍷
Первая 1000 🎉

Спасибо всем подписавшимся!
Рад что многим заходит технический контент про цифровому проектированию и новостям в мире полупроводников.
Вас же целая 1000 уже.
Лично для меня 1000 человек очень внушительное число. Чтобы вас всех вместе разместить это примерно 3-4 лекционных аудитории нужно забронировать😅

Дальше-больше!

p.s. кто отпишется после этого поста - никогда не выйдет из обработчика прерываний🤪

Stay tuned 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
55👍18😁92🤡2❤‍🔥1
Принес вам чтиво выходного дня

Статья
от исследователей из университета Pisa, Italy и Barcelona Supercomputing Center на тему применения сжатых вещественных числе в AI приложениях.
Считайте новинка - статья появилась на arXiv всего неделю назад 🤓

Статья исследует возможность сжатия чисел с плавающей запятой меньшей точности для глубоких нейронных сетей и предлагает метод распаковки/расжатия перед вычислениями, что может улучшить эффективность использования ресурсов и снизить нагрузку на кэш, при условии определенных архитектурных параметров.

Одной из активно обсуждаемых идей в последние несколько лет является использование формата Posit для хранения чисел в формате fp32 в 16-битном представлении Posit. Это сделано с целью снижения нагрузки на кэш и увеличения пропускной способности при передаче данных в вычислительные блоки. За такой трюк в пересылке данных заплатим точностью передаваемого числа и аппаратурой для конвертации fp32 -> posit16 и обратно, в то время, как для bfloat16 это происходит практически бесшовно, но с большей потерей точностью.

Основной акцент в статье сделан на работу с bf16, работа с Posit видимо оставила еще ряд нюансов, которые будут рассмотрены в следующих работах (либо я что-то проглядел когда читал статью).
Результаты и метод исследований найдешь в статье👌
🔥9👍6
У симулятора RIPES появилась web версия.

Если хотите вкатиться в изучении в computer architecture теперь это стало проще и доступнее.

В ripes вы можете настраивать микроархитектуру ядра: выбирать между однотактным и конвейерным ядром, добавлять механизмы разрешения конфликтов в конвейере и выбирать 32- или 64-битную архитектуру. Также предоставляется возможность менять конфигурацию кэша, алгоритм замещения данных и исполнять собственный код, c/asm.

Автор канала применял этот симулятор при подготовке лекции о влиянии конфигурации иерархии памяти на производительность процессора.

Запись лекции доступна на YouTube, а презентацию и материалы для лабораторных работ можно найти на GitHub.
🔥3331
Отличная подборка полезных материалов по RISC-V от Альянса RISC-V.

В подборке приведены ссылки на симуляторы, эмуляторы, учебные курсы и материалы различных мировых вузов, литературу по тематике архитектуры RISC-V.

Данный материал подготовлен как дополнение к анонсу конкурса на разработку и внедрение учебных материалов по RISC-V.

Пришло время обновить мой RISC-V Awesome list, за 2 года успел устареть😅
🔥20👍4🤩1
Подборка микроархитектурных блок-диаграм ядер от Intel, AMD, ARM, Ampere.

Block Diagrams: http://bit.ly/32qLLew
μarch Cheat Sheet: http://bit.ly/2JTplfJ

Для бесполезного, но интересного упражнения, можно посравнивать ядро Apple A15 (или любое другое, представленное в подборке) с решениями на базе RISC-V от Sifive P870 например или Syntacore SCR7/9.
👍133❤‍🔥1
На форуме lists.riscv.org представители Qualcomm предложили не использовать сжатые инструкции (C extension) для applications processors profile в RISC-V.
По их мнению, благодаря стандартным расширениям RISC-V и так достигается высокая плотность кода, а 16-битные инструкции делают микроархитектуру сложнее.

Имплементация compressed расширения усложняют проектирование и верификацию ядра. Это и усложнение логики декодера, дополнительная логика для поддержки не выровненной выборки (Unaligned fetch) из кэша, обработка инструкций пересекающие границы страниц памяти.

Важно понимать, что предлагается отказаться от compressed расширения только для applications processors profile, а не переписать существующую ISA RISC-V.
Compressed расширение все еще прекрасно вписывается в концепцию процессоров для встраиваемых систем.

Одним из аргументов против использования c-ext в профиле RVA23 является влияние c-ext на кодировку всех инструкций RISC-V архитектуре. В архитектуре RISC-V два младших бита инструкции указывают на формат инструкции. В стандартной кодировке из 32 доступных разрядов для кодирования инструкций два младших (с кодами 00, 01 и 10) предназначены для включения дополнительного набора сжатых инструкций, а код 11 предназначен для обозначения based (не сжатой) инструкции. Но если этот сжатый набор не нужен, то освобождаются еще три 30-разрядных слота для кодирования. Это увеличивает общий объем доступного кодирования в 32-разрядном формате в четыре раза.

Например, компания ARM для высокопроизводительных ядер, начиная с архитектура ARMv8a отказалась от поддержки Thumb.

Небольшое пояснение что же такое профиль. "Профиль" в этом контексте означает набор расширений, поддерживаемых конкретным ядром или приложением. Это позволяет разработчикам выбирать те функции, которые они хотят реализовать в своем продукте, при этом не требуется реализация всего множества расширений, предоставляемых архитектурой RISC-V.

p.s. хочу поблагодарить русскоязычное сообщество RISC-V за актуальные новостные обновления.
👍143🔥2
По старой традиции опять пропал на пару недель☺️
Перед RISC-V Summit привычный завал, но потихоньку буду возвращаться к ведению канала. Поговорим о новом чипе от Sophgo, партнёрстве Google и Qualcomm в проектировании чипов на базе RISC-V, и аргументах SiFive о сохранении C-extension для RVA профиля.

А сегодня обсудим первые шаги в разработке Matrix Extension для RISC-V ISA.

После заморозки для public review векторного расширения комитет RISC-V International приступил к выслушиванию предложений от членов RISC-V по теме матричного расширения. Сейчас различные компании представляют свое видение для развития будущего стандарта. После представления всех докладов будет сформирована рабочая группа, которая будет заниматься разработкой матричного расширения.

Матричные вычисления в контексте RISC-V ISA связаны с векторной спецификацией, а именно с векторными регистрами, где по определенным правилам и планируется хранить строки/столбцы матриц. Поэтому работа над матричным расширением не могла быть начата, пока векторное расширение не перешло в статус frozen.

За ходом работы комитета, а так же ознакомиться с записями прошедших обсуждений будущего стандарта и презентациями можно на github

Например, по этой ссылке можно ознакомиться с видением матричного расширения от Andes.

А по этой ссылке можно изучить презентацию и послушать доклад от представителей IBM и Esperanto.

Старт работы над матричным расширением RISC-V стал значимым шагом в эволюции архитектуры, привлекая разнообразных членов RISC-V для формирования будущего стандарта матричных вычислений. Этот процесс обещает открыть новые горизонты в мире вычислительных возможностей RISC-V.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥42
А что посмотреть/послушать про проектирование чипов?

Вышел подкаст с моими коллегами по цеху из Синтакор. Приглашенный гость - Никита Поляков инженер по цифровому дизайну с специализацией в проектировании процессорных кэшей.

https://youtu.be/kPirrDJBzw0?si=FsEHci11FC-Mw7Uh

Приглашенный гость известен многим по серии занятий в Цифровой Школе синтеза и лекциям на ChipExpo. Никита работал 12 лет в МЦСТ, а последние 3 года работает в Syntacore и имеет широкий кругозор в мире процессорных архитектур.
Так что в компетенциях гостя сомневаться не приходится.

К просмотру рекомендую. Отлично выпуск подойдет тем кто интересуется кто же такие hardware/rtl/verification инженеры, как выглядит разработка ASIC и что же это за verilog такой.

Большой респект проекту Истовый Инженер. Очень рад видеть подкасты по аппаратной тематике.
38👍71
AMD/Xilinx анонсировали soft-core RISC-V IP MicroBlaze V

AMD/Xilinx представили MicroBlaze V, который предлагает расширенные возможности конфигурации для поддержки различных наборов инструкций, включая I, M, A, C, F. Он также поддерживает bitmanip расширения (Zba, Zbb, Zbc, Zbs), что делает его более гибким и мощным инструментом для разработчиков.

В начале 2022-го года, Intel представила обновленный Nios V, который, по сравнению с MicroBlaze, представляется более простым в использовании. Nios V не поддерживает bitmanip расширения, а также не имеет функции сжатия кода (расширение "C"). Это может сказаться на эффективности использования памяти в FPGA, что важно для встраиваемых систем, где экономия памяти и гибкость являются критическими параметрами.

Подробнее про AMD MicroBlaze V : https://www.xilinx.com/products/design-tools/microblaze-v.html

Подробнее про Nios® V: https://www.intel.com/content/www/us/en/products/details/fpga/nios-processor/v.html
👍16🔥1😁1
RISC-V Summit North America 2023

Стартовал заключительный RISC-V Summit этого года.
С 6 по 8 ноября запланированы выступления ведущих разработчиков в области экосистемы RISC-V.

C расписанием докладов можно ознакомиться на сайте саммита.

Из докладов конечно же порекомендую послушать моих коллег из Semidynamics с докладом про имплеметнацию кастомного тензорного расширения.

Пока мы ожидаем доклады из США, предлагаю освежить в памяти выступления с китайского и европейского саммитов:

RISC-V Summit Europe
RISC-V Summit China
🔥10👍4
Записки CPU designer'a
AMD/Xilinx анонсировали soft-core RISC-V IP MicroBlaze V AMD/Xilinx представили MicroBlaze V, который предлагает расширенные возможности конфигурации для поддержки различных наборов инструкций, включая I, M, A, C, F. Он также поддерживает bitmanip расширения…
Synopsys ARC-V Processor IP

Intel, Xilinx вот и Synopsys расширяет портфель своих процессорных IP-ядер ARC новым семейством на базе RISC-V.

Synopsys ARC – это серия конфигурируемых процессорных ядер, разработанных для широкого спектра встраиваемых решений.

Думаю многие впервые слышат данную аббревиатуру из мира процессорных IP. Однако не стоит недооценивать значимость данного продукта. Ядра ARC от Synopsys стали основой для более чем 1,5 миллиарда устройств ежегодно, что однозначно свидетельствует о их влиянии и востребованности в индустрии встраиваемых систем.
Подобности о линейке ARC смотри в источнике.
🔥12👍2
Opensource реализация VPU на базе RISC-V Vector ISA 1.0 от Pulpino

Вы можете ознакомиться с статьей, в которой рассматривается микроархитектура и проблемы проектирования, на сайте arXiv.

Все исходные коды векторного блока доступны на GitHub в аккаунте pulp-platform.
👍30
Сегодня у нас короткий обзор актуальных новостей из мира цифорового дизайна 🤓

1. Аспирант МИЭТа стал контрибьютором в спецификацию RISC-V. Спасибо Андрею за его работу и вклад в развитие RISC-V спецификации.
Напомню, что Андрей один из основных контрибьюторов по курсу Архитектур процессорных систем. Все материалы по данному курсу доступны на github и youtube.

2. FPGA-Systems выпустили свой первый журнал - FPGA-Systems Magazine :: FSM. Журнал доступен бесплатно, без предварительной регистрации.
Мне особенно понравились статьи Николая Пузанова про использование фильтров в GTKWave [стр.141], и статья Юрия Панчула про конвейерные вычислители [стр.5].

Большое спасибо всем авторам журнала и отдельно Коробкову Михаилу за проделанную работу.

3. Стартовали конференции FPGA разработчиков. С анонсом конференции в Москве я проспал, поэтому дружно ждем запись на youtube канале плис-систем😅.
Конференции так же пройдут в следующих городах:
Санкт-Петербург - 2 декабря
Томск/Омск - 9 декабря

С программой конференции можно ознакомиться на сайте fpga-systems.
Must see доклад, по скромному мнению автора канала -
Ко-симуляция RISC-V IP с помощью QEMU для задач unit-верификации

Доклад представит мой коллега из Syntacore Кущенко Андрей
🔥30👍421
Принес вам ссылку на профиль с крутыми die shots.

У фотографа богатая коллекция снимков кристаллов процессоров от различных вендоров: AMD, Intel, Байкал, МЦСТ, Nvidia.

Например, вот ссылка на фотографии кристалла Baikal Electronics/BE-S1000 или фотографии кристалла gpu Nvidia/Pascal/GP106.

Больше siliconpr0n'a ищи по ссылке на фотохостинг 😎

#dieshots
🔥24👍1🌚1