TSMC’s executives found the idea so absurd that they took to calling Mr. Altman a “podcasting bro,” one of these people said. Adding just a few more chip-making plants, much less 36, was incredibly risky because of the money involved.
🗿🗿🗿
Вот это действительно интересная дискуссия, за которой стоит следить.
Пока Samsung Electronics и TSMC только рассматривают потенциальные места для строительства предприятий, Сэм Альтман просит сразу 36 заводов для производства AI-чипов нового поколения на сумму в 7 триллионов долларов, за что получил ёмкое прозвище от руководителей TSMC.
Оригинал статьи можно почитать в The New York Times.
NY Times
Behind OpenAI’s Audacious Plan to Make A.I. Flow Like Electricity
Sam Altman, OpenAI’s chief executive, is talking to the United Arab Emirates, Asian chipmakers and U.S. officials to expand the computing power needed to build artificial intelligence.
😁24 3👍2👀2
В продолжение новостей о предложениях по покупке Intel предлагаю ознакомиться с этой статьей, которая содержит обзор перспектив покупки бизнеса Intel компанией Qualcomm. В статье представлен хороший анализ и интересные аргументы в пользу теории, что Qualcomm просто троллит конкурента, прекрасно зная, что реальная сделка невозможна и не нужна обоим компаниям.
Спасибо Алексею за то, что поделился статьей в комментариях к одному из постов.
Спасибо Алексею за то, что поделился статьей в комментариях к одному из постов.
👍11
Всем привет! Надолго пропадать не собираюсь и в ближайшие дни постараюсь вернуться с новыми постами.
Пока что хочу поделиться с вами моим профилем на hashnode.
Туда планирую публиковать будущие лонгриды, а сейчас на сайте можно найти мои старые заметки по Импортозамещению в ЕС и пост о том, почему NaN'ы решили боксировать.
Старожилы канала уже знакомы с этими заметками, а недавно присоединившиеся читатели могли их пропустить, поэтому исправляем ситуацию🙏
https://cpudesign.hashnode.dev/
Пока что хочу поделиться с вами моим профилем на hashnode.
Туда планирую публиковать будущие лонгриды, а сейчас на сайте можно найти мои старые заметки по Импортозамещению в ЕС и пост о том, почему NaN'ы решили боксировать.
Старожилы канала уже знакомы с этими заметками, а недавно присоединившиеся читатели могли их пропустить, поэтому исправляем ситуацию
https://cpudesign.hashnode.dev/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13👀7
Принес вам запись доклада Yungang Bao. заместителя директора Института технологий вычислительной техники Китайской академии наук.
В докладе рассказывается о open-source проекте XiangShan и инициативе One Student One Chip, которые мы с вами обсуждали ранее.
Ссылка на видео🖥
В докладе рассказывается о open-source проекте XiangShan и инициативе One Student One Chip, которые мы с вами обсуждали ранее.
Ссылка на видео
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
An Open-Source Project for High-Performance RISC-V Processors Meeting Industrial-Grade Standards
Speaker: Yungang Bao. Deputy Director, Institute of Computing Technology, Chinese Academy of Sciences. Chief Scientist, Beijing Institute of Open Source Chip.
It is widely recognized that the open-source hardware ecosystem can reduce development costs and…
It is widely recognized that the open-source hardware ecosystem can reduce development costs and…
👍13👀2
Недавно прошла конференция, посвященная фреймворку Cocotb — инструменту для верификации аппаратного обеспечения на основе Python.
Особое внимание рекомендую обратить на доклад "cocotb 2.0: Modernize your testbenches for even more productivity", где подробно рассказано о нововведениях версии 2.0.
Особенно стоит изучить секцию, посвященную изменениям в типах значений (Value Type Changes), заменили класс BinaryValue!😮
Версия Cocotb 2.0 будет частично несовместима с Cocotb 1.9, поэтому могут потребоваться изменения в существующих тестбенчах.
Записи докладов и презентации доступны на сайте конференции: Tessolve DVClub Europe October 2024.
Особое внимание рекомендую обратить на доклад "cocotb 2.0: Modernize your testbenches for even more productivity", где подробно рассказано о нововведениях версии 2.0.
Особенно стоит изучить секцию, посвященную изменениям в типах значений (Value Type Changes), заменили класс BinaryValue!
Версия Cocotb 2.0 будет частично несовместима с Cocotb 1.9, поэтому могут потребоваться изменения в существующих тестбенчах.
Записи докладов и презентации доступны на сайте конференции: Tessolve DVClub Europe October 2024.
Please open Telegram to view this post
VIEW IN TELEGRAM
👀6👍4🎉1
Продолжаем тему конференций в мире цифрового дизайна и верификации.
Verification Futures Conference 2024, Austin (USA)
По ссылке можно найти список докладов с конференции. Если попытаться скачать отдельный доклад, появится окно с запросом на загрузку.
Однако, если скачать файл "VF2024 Austin Event Programme", то можно получить в одном документе сборник всех докладов с полями для заметок, прямо как в типичных раздаточных материалах.
Из забавного: Cadence в своем докладе рассказывает про AI-driven Verification и AI flow для генерации SystemVerilog Assertions на базе спецификации дизайна и Copilot.
Продолжаем следить за AI трендами в дизайне и верификации аппаратного обеспечения🤓
Verification Futures Conference 2024, Austin (USA)
По ссылке можно найти список докладов с конференции. Если попытаться скачать отдельный доклад, появится окно с запросом на загрузку.
Однако, если скачать файл "VF2024 Austin Event Programme", то можно получить в одном документе сборник всех докладов с полями для заметок, прямо как в типичных раздаточных материалах.
Из забавного: Cadence в своем докладе рассказывает про AI-driven Verification и AI flow для генерации SystemVerilog Assertions на базе спецификации дизайна и Copilot.
Продолжаем следить за AI трендами в дизайне и верификации аппаратного обеспечения
Please open Telegram to view this post
VIEW IN TELEGRAM
Tessolve
VF2024 Austin (USA)
Школа Синтеза: как войти в разработку аппаратного обеспечения ⌨️
Продолжаю рассказывать о бесплатных и открытых образовательных программах, и одна из них — уже многим известный проект "Школа Синтеза".
Одно из главных преимуществ Школы Синтеза — это бесплатный доступ к лекциям и заданиям, а так же возможность обсуждать задания, задавать вопросы в чате с преподавателями школы.
Единственное ограничение: если вы хотите обучаться в офлайн-кластерах, приоритет будет отдаваться действующим студентам, но всегда есть опция онлайн обучения.
Из нововведений этого года добавили базовый и продвинутый уровень. С блоком лекций можно ознакомиться на портале Истового Инженера.
Подать заявку на участие так же можно на портале Иствого Инженера.
Ознакомиться с записью лекций прошлых лет можно тут: YouTube.
🤓
Продолжаю рассказывать о бесплатных и открытых образовательных программах, и одна из них — уже многим известный проект "Школа Синтеза".
Одно из главных преимуществ Школы Синтеза — это бесплатный доступ к лекциям и заданиям, а так же возможность обсуждать задания, задавать вопросы в чате с преподавателями школы.
Единственное ограничение: если вы хотите обучаться в офлайн-кластерах, приоритет будет отдаваться действующим студентам, но всегда есть опция онлайн обучения.
Из нововведений этого года добавили базовый и продвинутый уровень. С блоком лекций можно ознакомиться на портале Истового Инженера.
Подать заявку на участие так же можно на портале Иствого Инженера.
Ознакомиться с записью лекций прошлых лет можно тут: YouTube.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥6✍4👀3 2
Понедельник день тяжелый, притащил вам мем с профунктора 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁47👍6🔥4 1
Драфт спецификации для матричного расширения RISC-V архитектуры.
Zvmm Family of Integrated Matrix Extensions, Version 0.1
IME — обозначает, что инструкции для работы с матрицами переиспользуют векторный регистровый файл, и данное расширение зависит от наличия и конфигурации векторного расширения.
Из интересных особенностей:
1) Новые инструкции для load/store не введены, вместо этого используются существующие векторные инструкции, такие как vle. Это позволяет избежать необходимости в изменении LSU pipeline и упрощает работу с памятью.
2) Выбран подход умножение вектора на матрицу, а не матрицу на матрицу, для упрощения аппаратуры, и как было указано выше, чтобы не усложнять LSU pipeline имплементацией более эффективных инструкций загрузки-сохранения матриц, а так же чтобы не раздвувать вычислительное ядро умножителями и деревом редукции частичных произведений.
Насколько это упрощение ценно и необходимо - вопрос открытый.
3) Zvmm32a16bf — в этом подмножестве анонсирована поддержка BF16, что оптимально для задач машинного обучения. Однако пока что не представлена поддержка FP16, что может стать предметом обсуждения для будущих версий.
4) Zvmm32a8mxf - поддержка 8-битных OCP MX типов данных, но не описана логика по работе с shared exponent.
5) Bulk normalization. Один из методов для проектирования матричного умножителя с плавающей точкой — использование bulk normalization. Этот подход предполагает динамическое выравнивание операндов относительно максимальной экспоненты в наборе, что позволяет значительно сократить аппаратные ресурсы.
Другой подход это конвертация float-point операндов в fixed point представлении. Этот подход дает бóльшую точность, избавляет от необходимости ранней нормализации, но намного затратнее с точки зрения аппаратуры.
Описание fixed-point подхода можно найти в данной статье.
Напоминаю, что это только драфт и многое еще может измениться🖥
Zvmm Family of Integrated Matrix Extensions, Version 0.1
IME — обозначает, что инструкции для работы с матрицами переиспользуют векторный регистровый файл, и данное расширение зависит от наличия и конфигурации векторного расширения.
Из интересных особенностей:
1) Новые инструкции для load/store не введены, вместо этого используются существующие векторные инструкции, такие как vle. Это позволяет избежать необходимости в изменении LSU pipeline и упрощает работу с памятью.
2) Выбран подход умножение вектора на матрицу, а не матрицу на матрицу, для упрощения аппаратуры, и как было указано выше, чтобы не усложнять LSU pipeline имплементацией более эффективных инструкций загрузки-сохранения матриц, а так же чтобы не раздвувать вычислительное ядро умножителями и деревом редукции частичных произведений.
Насколько это упрощение ценно и необходимо - вопрос открытый.
3) Zvmm32a16bf — в этом подмножестве анонсирована поддержка BF16, что оптимально для задач машинного обучения. Однако пока что не представлена поддержка FP16, что может стать предметом обсуждения для будущих версий.
4) Zvmm32a8mxf - поддержка 8-битных OCP MX типов данных, но не описана логика по работе с shared exponent.
5) Bulk normalization. Один из методов для проектирования матричного умножителя с плавающей точкой — использование bulk normalization. Этот подход предполагает динамическое выравнивание операндов относительно максимальной экспоненты в наборе, что позволяет значительно сократить аппаратные ресурсы.
Другой подход это конвертация float-point операндов в fixed point представлении. Этот подход дает бóльшую точность, избавляет от необходимости ранней нормализации, но намного затратнее с точки зрения аппаратуры.
Описание fixed-point подхода можно найти в данной статье.
Напоминаю, что это только драфт и многое еще может измениться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥5👀2 1
RISC-V Announces Ratification of the RVA23 Profile Standard
Давайте сначала разберёмся, что же такое профили и зачем они нужны.
RISC-V — это модульная архитектура, и разработчик процессоров может выбирать набор расширений, которые он хочет реализовать помимо базового набора, который является обязательным. Это делает проектирование проще и гибче, но значительно усложняет работу программистов.
Чтобы найти баланс между гибкостью и предсказуемостью поведения программного обеспечения, были разработаны профили, которые включают основной набор инструкций (базовое расширение) плюс определённые расширения.
Недавно был ратифицирован профиль RVA23 (Application profile). Основные отличия от прошлогоднего профиля: обязательная поддержка векторного расширения и расширения гипервизора.
Подробнее про то как устроены RISC-V профили можно почитать в блоге у Николаса Бруни🖥
Давайте сначала разберёмся, что же такое профили и зачем они нужны.
RISC-V — это модульная архитектура, и разработчик процессоров может выбирать набор расширений, которые он хочет реализовать помимо базового набора, который является обязательным. Это делает проектирование проще и гибче, но значительно усложняет работу программистов.
Чтобы найти баланс между гибкостью и предсказуемостью поведения программного обеспечения, были разработаны профили, которые включают основной набор инструкций (базовое расширение) плюс определённые расширения.
Недавно был ратифицирован профиль RVA23 (Application profile). Основные отличия от прошлогоднего профиля: обязательная поддержка векторного расширения и расширения гипервизора.
Подробнее про то как устроены RISC-V профили можно почитать в блоге у Николаса Бруни
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5
Валерий Шунков, разработчик аналоговых и силовых интегральных микросхем известный на хабре под ником amartology начал вести ламповый транзисторный телеграмм канал: t.me/parasiticresistance
strongly recommend☕️
strongly recommend
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎉5👀4✍3👍1
Будничное напоминание для всех, кто забыл или не знал, что в SystemVerilog существуют два разных типа данных:
🖥
int и integer, которые имеют разные определения. int — это 2-state (0, 1) тип данных, тогда как integer — это 4-state (0, 1, x, z) тип данных, что необходимо учитывать при верификации цифрового дизайна.Please open Telegram to view this post
VIEW IN TELEGRAM
👀18✍12👍7🔥1
У компании Anlogic, оказывается, есть SoC с встроенным RISC-V ядром, может кого заинтересует.
Документация доступна после регистрации, так что пока что не изучил что же там за ядро используется.
Пока искал информацию о новом вендоре на Reddit'e наткнулся на подборку производителей FPGA.
Не уверен, насколько этот список актуален для 2024 года, но тоже приложу к посту:
http://www.xilinx.com/
http://www.altera.com/
https://www.latticesemi.com/
http://www.microsemi.com/
https://www.gowinsemi.com/en/
http://www.achronix.com/
https://www.quicklogic.com/
https://www.dialog-semiconductor.com/products/greenpak/low-power-low-cost-forgefpga
https://github.com/os-fpga
(у домена osfpga
https://anlogic.com/en
https://github.com/AnlogicInfo
https://www.efinixinc.com/
https://colognechip.com/
https://pangomicro.com/en/
http://www.isilicontech.com/
http://www.agm-micro.com/
Документация доступна после регистрации, так что пока что не изучил что же там за ядро используется.
Пока искал информацию о новом вендоре на Reddit'e наткнулся на подборку производителей FPGA.
Не уверен, насколько этот список актуален для 2024 года, но тоже приложу к посту:
http://www.xilinx.com/
http://www.altera.com/
https://www.latticesemi.com/
http://www.microsemi.com/
https://www.gowinsemi.com/en/
http://www.achronix.com/
https://www.quicklogic.com/
https://www.dialog-semiconductor.com/products/greenpak/low-power-low-cost-forgefpga
https://github.com/os-fpga
(у домена osfpga
точкаorg видимо просрочена оплата домена и теперь по поиску редиректит на стремный сайт, поэтому оставил ссылку на их github)https://anlogic.com/en
https://github.com/AnlogicInfo
https://www.efinixinc.com/
https://colognechip.com/
https://pangomicro.com/en/
http://www.isilicontech.com/
http://www.agm-micro.com/
🔥7👍6✍1🎉1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32👍7 3
Крутой Community Highlight про чипы серии Tenstorrent Wormhole.
Так же в блоге corsix, где изначально и опубликованы посты про Wormhole, можно найти занимательные заметки по тематике computer science: программные tips and tricks при конвертации флотов или заметки про x86 macro-op fusion.
🖥
Так же в блоге corsix, где изначально и опубликованы посты про Wormhole, можно найти занимательные заметки по тематике computer science: программные tips and tricks при конвертации флотов или заметки про x86 macro-op fusion.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Forwarded from fpga_news
Tenstorrent Wormhole Series
Part 1: Physicalities
Part 2: Which disabled rows?
Part 3: NoC propagation delay
Part 4: A touch of Ethernet
Part 5: Taking apart T tiles
Part 6: Vector instruction set
Part 7: Bits of the MatMul
https://tenstorrent.com/vision/community-highlight-tenstorrent-wormhole-series-part-1-physicalities
Part 1: Physicalities
Part 2: Which disabled rows?
Part 3: NoC propagation delay
Part 4: A touch of Ethernet
Part 5: Taking apart T tiles
Part 6: Vector instruction set
Part 7: Bits of the MatMul
https://tenstorrent.com/vision/community-highlight-tenstorrent-wormhole-series-part-1-physicalities
Tenstorrent
Community Highlight: Tenstorrent Wormhole Series Part 1: Physicalities | Tenstorrent
An in depth look at Tenstorrent Wormhole, originally posted on corsix.org
👍6✍5
Не так давно на канале обсуждали различные симуляторы для моделирования и оценки производительности процессорных архитектур, включая gem5.
Краткий обзор, что такое gem5 и зачем он нужен:
1. Позволяет моделировать и анализировать производительность различных процессорных архитектур.
2. Используется для быстрого тестирования идей без создания реального оборудования. Симулятор позволяет проверить гипотезы и предложения, прежде чем начинать процесс аппаратно-программного проектирования.
После краткой справки хочу поделиться с вами YouTube-каналом ARM Research и замечательной лекцией — Learning gem5: Modeling Cache Coherence with gem5.
В видео вы узнаете об истории создания gem5, а также о задачах и проблемах моделирования когерентного кэша💾
Краткий обзор, что такое gem5 и зачем он нужен:
1. Позволяет моделировать и анализировать производительность различных процессорных архитектур.
2. Используется для быстрого тестирования идей без создания реального оборудования. Симулятор позволяет проверить гипотезы и предложения, прежде чем начинать процесс аппаратно-программного проектирования.
После краткой справки хочу поделиться с вами YouTube-каналом ARM Research и замечательной лекцией — Learning gem5: Modeling Cache Coherence with gem5.
В видео вы узнаете об истории создания gem5, а также о задачах и проблемах моделирования когерентного кэша
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11
mpsoc_2022_final_grasset.pdf
2.6 MB
Обзорная презентация Scalable Matrix Extension от ARM.
Наиболее занимательной является новая архитектурно видимая область памяти ZA tile storage, которая позволяет вычитывать данные как построчно, так и по столбцам, обеспечивая возможность динамического транспонирования матриц.
Больше деталей по работе с матричным расширением можно найти в SME Programmer’s Guide.
Наиболее занимательной является новая архитектурно видимая область памяти ZA tile storage, которая позволяет вычитывать данные как построчно, так и по столбцам, обеспечивая возможность динамического транспонирования матриц.
Больше деталей по работе с матричным расширением можно найти в SME Programmer’s Guide.
👍14🔥4 1
Hello SME
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.
Наиболее интересной частью ресурса является раздел Microbenchmarks.
Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.
Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.
Исходники бенчмарков - scalable-analyses/sme
Buen Finde!🖥
Да-да, снова ARM. На ресурсе по ссылке выше вы найдете краткое описание расширений Neon, Apple AMX и SME.
Наиболее интересной частью ресурса является раздел Microbenchmarks.
Тесты проводились на процессоре M4. Бенчмарки написаны так, чтобы избежать зависимостей между инструкциями.
Бенчмарки чипа M4 включали тестирование пиковой производительности и масштабируемости инструкций для FP32, FP16, BF16 и целочисленных данных (I8, I16) с использованием векторных операций (Neon, SVE), матричных расширений (SME, AMX) и инструкций загрузки/сохранения данных в ZA tile storage.
Исходники бенчмарков - scalable-analyses/sme
Buen Finde!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2
Lattice Semiconductor рассматривает полное приобретение FPGA подразделения Altera у Intel.
Altera обошлась Intel в $17 млрд, но рыночная цена может быть ниже.
🍿
Altera обошлась Intel в $17 млрд, но рыночная цена может быть ниже.
Please open Telegram to view this post
VIEW IN TELEGRAM
👀33😁10👍5