官术网_书友最值得收藏!

1.8 思考題

1.什么情況下不能采用循環交換來優化程序性能?

2.在使用多核并行優化時,是否開啟并行線程越多性能就越好?

3.在本章的矩陣乘法案例中,如何快速確定性能最優的循環分塊大小?

4.本章利用AVX內建函數對矩陣乘法進行優化時,實際上采用了基于256位寄存器的Intel AVX2指令。如果采用基于512位寄存器的Intel AVX-512 指令,程序性能會如何變化呢?請通過實驗進行驗證。

5.通過本章的案例,分析影響矩陣乘法性能的因素。是否可以建立一個關于矩陣乘法性能的數學模型?

主站蜘蛛池模板: 瑞金市| 隆子县| 林西县| 赤峰市| 石柱| 台州市| 汉源县| 澄江县| 陇西县| 平果县| 鹿邑县| 孟连| 东山县| 磐安县| 张掖市| 松桃| 大关县| 凉城县| 吉林市| 寿阳县| 安义县| 南澳县| 上饶市| 冀州市| 麟游县| 九江市| 长海县| 隆林| 万盛区| 哈尔滨市| 邹平县| 固原市| 兴山县| 柞水县| 行唐县| 金溪县| 化隆| 德兴市| 隆回县| 丹江口市| 乌兰浩特市|