NEW BOT Телеграм, страница

Channel created

14:23

На процессорах Intel Sandy Bridge и выше - до Broadwell, инструкция ADC занимает 2uop при декодировании и имеет latency 2.
Это та информация которую вы легко можете найти у Агнера Фога: agner.org/optimize.
Однако, эта информация не полна. Начиная с Intel Sandy Bridge Family, процессор при обработке данной команды поддерживает специальный случай, а именно:

ADC Reg64, 0

Здесь мы получим декодирование ADC как 1uop и latency 1. Факт, вообще говоря нигде не описанный и мало кому известный. Да, теперь ты знаешь больше!

#optimization #asm

agner.org

Software optimization resources. C++ and assembly. Windows, Linux, BSD, Mac OS X

Software optimization manuals for C++ and assembly code. Intel and AMD x86 microprocessors.
Windows, Linux, BSD, Mac OS X. 16, 32 and 64 bit systems. Detailed denoscriptions of microarchitectures.

1.16K viewsedited 19:01

1.12K views01:57

Вот здесь^ найдешь FAQ по замеру Latency / Throughput на Arm Cortex A53, а также, некоторые произведенные замеры, что бесспорно улучшит качество твоего ПО под мобильные платформы: +скорость, +энергоэкономность.

#optimization #arm #asm

1.32K viewsedited 01:59

0x1337

О обратной связи с автором этого канала, красивых цифрах и просто хвастовстве:
=========================
Phone: +7 987 111 1337
Автомобильный номер вида x777xx
Site: https://1337.xxx
=========================

#callback #contacts

1.47K viewsedited 09:27

0x1337

0x1337 pinned «О обратной связи с автором этого канала, красивых цифрах и просто хвастовстве: ========================= Phone: +7 987 111 1337 Автомобильный номер вида x777xx Site: https://1337.xxx ========================= #callback #contacts»

09:27

0x1337

dynamic_cast<void*>(T)

возвращает указатель на 'Самый Производный Класс' в иерархии!

#cxx #interesting

1.44K viewsedited 12:02

0x1337

image_2019-09-18_15-24-00.png

29.1 KB

О том, почему компиляторы не так хороши, как тебе говорят^. Фиксится, кстати, заменой uint64_t на int64_t.

#optimization #asm #cxx

1.2K viewsedited 12:24

0x1337

image_2019-09-18_15-24-00.png

Ну и раз уж пошли такие тЁрки, вот тебе советец:
Работая с RT преобразованиями типов, обязательно проверяй генерируемый ASM код. Особенно, когда речь заходит о преобразованиях знаковых типов в беззнаковые. Интуитивно кажется что с беззнаковыми типами работать быстрее. Однако, это ловушка, которая очень круто показывает себя, например при преобразовании double->uint64_t.

#asm #cxx #missoptimization

989 viewsedited 12:29

0x1337

Да, ты ведь знаешь, что static_cast<integer_type> из double / float типа, хотя и выполняется compile-time - дает накладные расходы в run-time? Неплохие такие расходы, я бы сказал!

#cxx #optimisation

957 viewsedited 12:32

0x1337

instruction_tables.pdf

1.2 MB

Вот^ почитай на ночь.

#optimization #cxx #asm

1.06K viewsedited 19:09

0x1337

Табличка с замерами Latency / Throughput, которой ну очень удобно пользоваться. Кстати, информация куда более полная чем у Агнера Фога:
https://uops.info/table.html

#optimization #asm

2.08K views09:22

About

Blog

Apps

Platform