Всем привет! Надолго пропадать не собираюсь и в ближайшие дни постараюсь вернуться с новыми постами.
Пока что хочу поделиться с вами моим профилем на hashnode.
Туда планирую публиковать будущие лонгриды, а сейчас на сайте можно найти мои старые заметки по Импортозамещению в ЕС и пост о том, почему NaN'ы решили боксировать.
Старожилы канала уже знакомы с этими заметками, а недавно присоединившиеся читатели могли их пропустить, поэтому исправляем ситуацию🙏
https://cpudesign.hashnode.dev/
Пока что хочу поделиться с вами моим профилем на hashnode.
Туда планирую публиковать будущие лонгриды, а сейчас на сайте можно найти мои старые заметки по Импортозамещению в ЕС и пост о том, почему NaN'ы решили боксировать.
Старожилы канала уже знакомы с этими заметками, а недавно присоединившиеся читатели могли их пропустить, поэтому исправляем ситуацию
https://cpudesign.hashnode.dev/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13👀7
Принес вам запись доклада Yungang Bao. заместителя директора Института технологий вычислительной техники Китайской академии наук.
В докладе рассказывается о open-source проекте XiangShan и инициативе One Student One Chip, которые мы с вами обсуждали ранее.
Ссылка на видео🖥
В докладе рассказывается о open-source проекте XiangShan и инициативе One Student One Chip, которые мы с вами обсуждали ранее.
Ссылка на видео
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
An Open-Source Project for High-Performance RISC-V Processors Meeting Industrial-Grade Standards
Speaker: Yungang Bao. Deputy Director, Institute of Computing Technology, Chinese Academy of Sciences. Chief Scientist, Beijing Institute of Open Source Chip.
It is widely recognized that the open-source hardware ecosystem can reduce development costs and…
It is widely recognized that the open-source hardware ecosystem can reduce development costs and…
👍13👀2
Недавно прошла конференция, посвященная фреймворку Cocotb — инструменту для верификации аппаратного обеспечения на основе Python.
Особое внимание рекомендую обратить на доклад "cocotb 2.0: Modernize your testbenches for even more productivity", где подробно рассказано о нововведениях версии 2.0.
Особенно стоит изучить секцию, посвященную изменениям в типах значений (Value Type Changes), заменили класс BinaryValue!😮
Версия Cocotb 2.0 будет частично несовместима с Cocotb 1.9, поэтому могут потребоваться изменения в существующих тестбенчах.
Записи докладов и презентации доступны на сайте конференции: Tessolve DVClub Europe October 2024.
Особое внимание рекомендую обратить на доклад "cocotb 2.0: Modernize your testbenches for even more productivity", где подробно рассказано о нововведениях версии 2.0.
Особенно стоит изучить секцию, посвященную изменениям в типах значений (Value Type Changes), заменили класс BinaryValue!
Версия Cocotb 2.0 будет частично несовместима с Cocotb 1.9, поэтому могут потребоваться изменения в существующих тестбенчах.
Записи докладов и презентации доступны на сайте конференции: Tessolve DVClub Europe October 2024.
Please open Telegram to view this post
VIEW IN TELEGRAM
👀6👍4🎉1
Продолжаем тему конференций в мире цифрового дизайна и верификации.
Verification Futures Conference 2024, Austin (USA)
По ссылке можно найти список докладов с конференции. Если попытаться скачать отдельный доклад, появится окно с запросом на загрузку.
Однако, если скачать файл "VF2024 Austin Event Programme", то можно получить в одном документе сборник всех докладов с полями для заметок, прямо как в типичных раздаточных материалах.
Из забавного: Cadence в своем докладе рассказывает про AI-driven Verification и AI flow для генерации SystemVerilog Assertions на базе спецификации дизайна и Copilot.
Продолжаем следить за AI трендами в дизайне и верификации аппаратного обеспечения🤓
Verification Futures Conference 2024, Austin (USA)
По ссылке можно найти список докладов с конференции. Если попытаться скачать отдельный доклад, появится окно с запросом на загрузку.
Однако, если скачать файл "VF2024 Austin Event Programme", то можно получить в одном документе сборник всех докладов с полями для заметок, прямо как в типичных раздаточных материалах.
Из забавного: Cadence в своем докладе рассказывает про AI-driven Verification и AI flow для генерации SystemVerilog Assertions на базе спецификации дизайна и Copilot.
Продолжаем следить за AI трендами в дизайне и верификации аппаратного обеспечения
Please open Telegram to view this post
VIEW IN TELEGRAM
Tessolve
VF2024 Austin (USA)
Школа Синтеза: как войти в разработку аппаратного обеспечения ⌨️
Продолжаю рассказывать о бесплатных и открытых образовательных программах, и одна из них — уже многим известный проект "Школа Синтеза".
Одно из главных преимуществ Школы Синтеза — это бесплатный доступ к лекциям и заданиям, а так же возможность обсуждать задания, задавать вопросы в чате с преподавателями школы.
Единственное ограничение: если вы хотите обучаться в офлайн-кластерах, приоритет будет отдаваться действующим студентам, но всегда есть опция онлайн обучения.
Из нововведений этого года добавили базовый и продвинутый уровень. С блоком лекций можно ознакомиться на портале Истового Инженера.
Подать заявку на участие так же можно на портале Иствого Инженера.
Ознакомиться с записью лекций прошлых лет можно тут: YouTube.
🤓
Продолжаю рассказывать о бесплатных и открытых образовательных программах, и одна из них — уже многим известный проект "Школа Синтеза".
Одно из главных преимуществ Школы Синтеза — это бесплатный доступ к лекциям и заданиям, а так же возможность обсуждать задания, задавать вопросы в чате с преподавателями школы.
Единственное ограничение: если вы хотите обучаться в офлайн-кластерах, приоритет будет отдаваться действующим студентам, но всегда есть опция онлайн обучения.
Из нововведений этого года добавили базовый и продвинутый уровень. С блоком лекций можно ознакомиться на портале Истового Инженера.
Подать заявку на участие так же можно на портале Иствого Инженера.
Ознакомиться с записью лекций прошлых лет можно тут: YouTube.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥6✍4👀3 2
Понедельник день тяжелый, притащил вам мем с профунктора 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁47👍6🔥4 1
Драфт спецификации для матричного расширения RISC-V архитектуры.
Zvmm Family of Integrated Matrix Extensions, Version 0.1
IME — обозначает, что инструкции для работы с матрицами переиспользуют векторный регистровый файл, и данное расширение зависит от наличия и конфигурации векторного расширения.
Из интересных особенностей:
1) Новые инструкции для load/store не введены, вместо этого используются существующие векторные инструкции, такие как vle. Это позволяет избежать необходимости в изменении LSU pipeline и упрощает работу с памятью.
2) Выбран подход умножение вектора на матрицу, а не матрицу на матрицу, для упрощения аппаратуры, и как было указано выше, чтобы не усложнять LSU pipeline имплементацией более эффективных инструкций загрузки-сохранения матриц, а так же чтобы не раздвувать вычислительное ядро умножителями и деревом редукции частичных произведений.
Насколько это упрощение ценно и необходимо - вопрос открытый.
3) Zvmm32a16bf — в этом подмножестве анонсирована поддержка BF16, что оптимально для задач машинного обучения. Однако пока что не представлена поддержка FP16, что может стать предметом обсуждения для будущих версий.
4) Zvmm32a8mxf - поддержка 8-битных OCP MX типов данных, но не описана логика по работе с shared exponent.
5) Bulk normalization. Один из методов для проектирования матричного умножителя с плавающей точкой — использование bulk normalization. Этот подход предполагает динамическое выравнивание операндов относительно максимальной экспоненты в наборе, что позволяет значительно сократить аппаратные ресурсы.
Другой подход это конвертация float-point операндов в fixed point представлении. Этот подход дает бóльшую точность, избавляет от необходимости ранней нормализации, но намного затратнее с точки зрения аппаратуры.
Описание fixed-point подхода можно найти в данной статье.
Напоминаю, что это только драфт и многое еще может измениться🖥
Zvmm Family of Integrated Matrix Extensions, Version 0.1
IME — обозначает, что инструкции для работы с матрицами переиспользуют векторный регистровый файл, и данное расширение зависит от наличия и конфигурации векторного расширения.
Из интересных особенностей:
1) Новые инструкции для load/store не введены, вместо этого используются существующие векторные инструкции, такие как vle. Это позволяет избежать необходимости в изменении LSU pipeline и упрощает работу с памятью.
2) Выбран подход умножение вектора на матрицу, а не матрицу на матрицу, для упрощения аппаратуры, и как было указано выше, чтобы не усложнять LSU pipeline имплементацией более эффективных инструкций загрузки-сохранения матриц, а так же чтобы не раздвувать вычислительное ядро умножителями и деревом редукции частичных произведений.
Насколько это упрощение ценно и необходимо - вопрос открытый.
3) Zvmm32a16bf — в этом подмножестве анонсирована поддержка BF16, что оптимально для задач машинного обучения. Однако пока что не представлена поддержка FP16, что может стать предметом обсуждения для будущих версий.
4) Zvmm32a8mxf - поддержка 8-битных OCP MX типов данных, но не описана логика по работе с shared exponent.
5) Bulk normalization. Один из методов для проектирования матричного умножителя с плавающей точкой — использование bulk normalization. Этот подход предполагает динамическое выравнивание операндов относительно максимальной экспоненты в наборе, что позволяет значительно сократить аппаратные ресурсы.
Другой подход это конвертация float-point операндов в fixed point представлении. Этот подход дает бóльшую точность, избавляет от необходимости ранней нормализации, но намного затратнее с точки зрения аппаратуры.
Описание fixed-point подхода можно найти в данной статье.
Напоминаю, что это только драфт и многое еще может измениться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥5👀2 1
RISC-V Announces Ratification of the RVA23 Profile Standard
Давайте сначала разберёмся, что же такое профили и зачем они нужны.
RISC-V — это модульная архитектура, и разработчик процессоров может выбирать набор расширений, которые он хочет реализовать помимо базового набора, который является обязательным. Это делает проектирование проще и гибче, но значительно усложняет работу программистов.
Чтобы найти баланс между гибкостью и предсказуемостью поведения программного обеспечения, были разработаны профили, которые включают основной набор инструкций (базовое расширение) плюс определённые расширения.
Недавно был ратифицирован профиль RVA23 (Application profile). Основные отличия от прошлогоднего профиля: обязательная поддержка векторного расширения и расширения гипервизора.
Подробнее про то как устроены RISC-V профили можно почитать в блоге у Николаса Бруни🖥
Давайте сначала разберёмся, что же такое профили и зачем они нужны.
RISC-V — это модульная архитектура, и разработчик процессоров может выбирать набор расширений, которые он хочет реализовать помимо базового набора, который является обязательным. Это делает проектирование проще и гибче, но значительно усложняет работу программистов.
Чтобы найти баланс между гибкостью и предсказуемостью поведения программного обеспечения, были разработаны профили, которые включают основной набор инструкций (базовое расширение) плюс определённые расширения.
Недавно был ратифицирован профиль RVA23 (Application profile). Основные отличия от прошлогоднего профиля: обязательная поддержка векторного расширения и расширения гипервизора.
Подробнее про то как устроены RISC-V профили можно почитать в блоге у Николаса Бруни
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5
Валерий Шунков, разработчик аналоговых и силовых интегральных микросхем известный на хабре под ником amartology начал вести ламповый транзисторный телеграмм канал: t.me/parasiticresistance
strongly recommend☕️
strongly recommend
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎉5👀4✍3👍1
Будничное напоминание для всех, кто забыл или не знал, что в SystemVerilog существуют два разных типа данных:
🖥
int и integer, которые имеют разные определения. int — это 2-state (0, 1) тип данных, тогда как integer — это 4-state (0, 1, x, z) тип данных, что необходимо учитывать при верификации цифрового дизайна.Please open Telegram to view this post
VIEW IN TELEGRAM
👀18✍12👍7🔥1
У компании Anlogic, оказывается, есть SoC с встроенным RISC-V ядром, может кого заинтересует.
Документация доступна после регистрации, так что пока что не изучил что же там за ядро используется.
Пока искал информацию о новом вендоре на Reddit'e наткнулся на подборку производителей FPGA.
Не уверен, насколько этот список актуален для 2024 года, но тоже приложу к посту:
http://www.xilinx.com/
http://www.altera.com/
https://www.latticesemi.com/
http://www.microsemi.com/
https://www.gowinsemi.com/en/
http://www.achronix.com/
https://www.quicklogic.com/
https://www.dialog-semiconductor.com/products/greenpak/low-power-low-cost-forgefpga
https://github.com/os-fpga
(у домена osfpga
https://anlogic.com/en
https://github.com/AnlogicInfo
https://www.efinixinc.com/
https://colognechip.com/
https://pangomicro.com/en/
http://www.isilicontech.com/
http://www.agm-micro.com/
Документация доступна после регистрации, так что пока что не изучил что же там за ядро используется.
Пока искал информацию о новом вендоре на Reddit'e наткнулся на подборку производителей FPGA.
Не уверен, насколько этот список актуален для 2024 года, но тоже приложу к посту:
http://www.xilinx.com/
http://www.altera.com/
https://www.latticesemi.com/
http://www.microsemi.com/
https://www.gowinsemi.com/en/
http://www.achronix.com/
https://www.quicklogic.com/
https://www.dialog-semiconductor.com/products/greenpak/low-power-low-cost-forgefpga
https://github.com/os-fpga
(у домена osfpga
точкаorg видимо просрочена оплата домена и теперь по поиску редиректит на стремный сайт, поэтому оставил ссылку на их github)https://anlogic.com/en
https://github.com/AnlogicInfo
https://www.efinixinc.com/
https://colognechip.com/
https://pangomicro.com/en/
http://www.isilicontech.com/
http://www.agm-micro.com/
🔥7👍6✍1🎉1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32👍7 3
Крутой Community Highlight про чипы серии Tenstorrent Wormhole.
Так же в блоге corsix, где изначально и опубликованы посты про Wormhole, можно найти занимательные заметки по тематике computer science: программные tips and tricks при конвертации флотов или заметки про x86 macro-op fusion.
🖥
Так же в блоге corsix, где изначально и опубликованы посты про Wormhole, можно найти занимательные заметки по тематике computer science: программные tips and tricks при конвертации флотов или заметки про x86 macro-op fusion.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Forwarded from fpga_news
Tenstorrent Wormhole Series
Part 1: Physicalities
Part 2: Which disabled rows?
Part 3: NoC propagation delay
Part 4: A touch of Ethernet
Part 5: Taking apart T tiles
Part 6: Vector instruction set
Part 7: Bits of the MatMul
https://tenstorrent.com/vision/community-highlight-tenstorrent-wormhole-series-part-1-physicalities
Part 1: Physicalities
Part 2: Which disabled rows?
Part 3: NoC propagation delay
Part 4: A touch of Ethernet
Part 5: Taking apart T tiles
Part 6: Vector instruction set
Part 7: Bits of the MatMul
https://tenstorrent.com/vision/community-highlight-tenstorrent-wormhole-series-part-1-physicalities
Tenstorrent
Community Highlight: Tenstorrent Wormhole Series Part 1: Physicalities | Tenstorrent
An in depth look at Tenstorrent Wormhole, originally posted on corsix.org
👍6✍5
Не так давно на канале обсуждали различные симуляторы для моделирования и оценки производительности процессорных архитектур, включая gem5.
Краткий обзор, что такое gem5 и зачем он нужен:
1. Позволяет моделировать и анализировать производительность различных процессорных архитектур.
2. Используется для быстрого тестирования идей без создания реального оборудования. Симулятор позволяет проверить гипотезы и предложения, прежде чем начинать процесс аппаратно-программного проектирования.
После краткой справки хочу поделиться с вами YouTube-каналом ARM Research и замечательной лекцией — Learning gem5: Modeling Cache Coherence with gem5.
В видео вы узнаете об истории создания gem5, а также о задачах и проблемах моделирования когерентного кэша💾
Краткий обзор, что такое gem5 и зачем он нужен:
1. Позволяет моделировать и анализировать производительность различных процессорных архитектур.
2. Используется для быстрого тестирования идей без создания реального оборудования. Симулятор позволяет проверить гипотезы и предложения, прежде чем начинать процесс аппаратно-программного проектирования.
После краткой справки хочу поделиться с вами YouTube-каналом ARM Research и замечательной лекцией — Learning gem5: Modeling Cache Coherence with gem5.
В видео вы узнаете об истории создания gem5, а также о задачах и проблемах моделирования когерентного кэша
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11
mpsoc_2022_final_grasset.pdf
2.6 MB
Обзорная презентация Scalable Matrix Extension от ARM.
Наиболее занимательной является новая архитектурно видимая область памяти ZA tile storage, которая позволяет вычитывать данные как построчно, так и по столбцам, обеспечивая возможность динамического транспонирования матриц.
Больше деталей по работе с матричным расширением можно найти в SME Programmer’s Guide.
Наиболее занимательной является новая архитектурно видимая область памяти ZA tile storage, которая позволяет вычитывать данные как построчно, так и по столбцам, обеспечивая возможность динамического транспонирования матриц.
Больше деталей по работе с матричным расширением можно найти в SME Programmer’s Guide.
👍14🔥4 1
Hello SME
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.
Наиболее интересной частью ресурса является раздел Microbenchmarks.
Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.
Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.
Исходники бенчмарков - scalable-analyses/sme
Buen Finde!🖥
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.
Наиболее интересной частью ресурса является раздел Microbenchmarks.
Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.
Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.
Исходники бенчмарков - scalable-analyses/sme
Buen Finde!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2
Lattice Semiconductor рассматривает полное приобретение FPGA подразделения Altera у Intel.
Altera обошлась Intel в $17 млрд, но рыночная цена может быть ниже.
🍿
Altera обошлась Intel в $17 млрд, но рыночная цена может быть ниже.
Please open Telegram to view this post
VIEW IN TELEGRAM
👀33😁10👍5
Bringup-Bench — это набор тестов на языке C с открытым исходным кодом, предназначенных для упрощения тестирования новых процессоров, ускорителей, компиляторов и операционных систем.
Ключевые особенности:
1) Открытый исходный код: тесты представлены в виде исходного кода. Это позволяет собирать их под целевой процессор, что особенно полезно для baremetal-систем с произвольной Memory Map.
Когда мы обсуждали набор программных тестов от Tenstorrent, там как раз была проблема с зависимостями адресного пространства, т.к. инженеры Tenstorrent опубликовали .elf файлы и файлы дизасемблера, а не исходные коды программы.
2) Почти полное отсутствие системных зависимостей: требуется реализация всего 4 системных вызовов для работы всех тестов. Подробнее смотри раздел Minimal system dependencies.
Спасибо автору VLSI Hub за наводку☺️
Ключевые особенности:
1) Открытый исходный код: тесты представлены в виде исходного кода. Это позволяет собирать их под целевой процессор, что особенно полезно для baremetal-систем с произвольной Memory Map.
Когда мы обсуждали набор программных тестов от Tenstorrent, там как раз была проблема с зависимостями адресного пространства, т.к. инженеры Tenstorrent опубликовали .elf файлы и файлы дизасемблера, а не исходные коды программы.
2) Почти полное отсутствие системных зависимостей: требуется реализация всего 4 системных вызовов для работы всех тестов. Подробнее смотри раздел Minimal system dependencies.
Спасибо автору VLSI Hub за наводку
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - toddmaustin/bringup-bench: Bringup-Bench is a collection of standalone minimal library and system dependence benchmarks…
Bringup-Bench is a collection of standalone minimal library and system dependence benchmarks useful for bringing up newly designed CPUs, accelerators, compilers and operating systems. You probably ...
🔥13👍12