- 并行編程方法與優化實踐
- 劉文志
- 416字
- 2019-01-01 01:08:33
2.2 ARM A15處理器性能
ARM A15處理器具有4個核心,核心的最高頻率為2.3GHz,因此其單核理論32位浮點峰值計算能力為2.3×4×2=18.4GFLOPS,4核即為73.6GFLOPS,這大約是8年前單路服務器級X86處理器的性能。如果未來的ARM處理器支持使用16位浮點數運算的話,則其理論峰值計算能力將翻倍。
A15處理器每個核心都具有獨立的L1指令緩存和數據緩存,兩者大小都是32KB,采用2路組相聯映射策略,緩存線長度為64字節,替換策略采用最近最少使用策略。筆者測試發現,其L1緩存讀帶寬為每核心每時鐘周期16字節,延遲為8個時鐘周期,故要發揮其性能需要的并行度為128字節,即總共有128字節的讀訪問正在流水線上進行。如果使用128位SIMD讀指令,則需要8條;如果使用256位的SIMD讀指令,則需要4條。
A15處理器4個核心共享統一的L2緩存。L2緩存的大小可配置為512KB、1MB、2MB,甚至4MB大小;采用16路組相聯映射策略,緩存線長度為64字節,替換策略采用隨機策略。
NVIDIA tegra tk1開發板配置的內存容量為2GB的DDR3L,內存頻率為933MHz,數據寬度為64位,故其理論峰值帶寬為0.933×8=7.46GB/s。
推薦閱讀
- 零基礎PHP學習筆記
- Boost C++ Application Development Cookbook(Second Edition)
- 青少年軟件編程基礎與實戰(圖形化編程三級)
- C/C++常用算法手冊(第3版)
- Learning ArcGIS Pro
- MySQL數據庫管理與開發實踐教程 (清華電腦學堂)
- 名師講壇:Java微服務架構實戰(SpringBoot+SpringCloud+Docker+RabbitMQ)
- Android開發案例教程與項目實戰(在線實驗+在線自測)
- Mastering Android Game Development
- PHP+MySQL+Dreamweaver動態網站開發從入門到精通(第3版)
- Natural Language Processing with Java and LingPipe Cookbook
- Spring Boot+MVC實戰指南
- Visual FoxPro 6.0程序設計
- Python Programming for Arduino
- 軟件測試技術