官术网_书友最值得收藏!

1.2 AI芯片:CPU、GPU、FPGA、ASIC

一般來說,目前的主流商業化AI芯片包含CPU、GPU、現場可編程門陣列(Field Programmable Gate Array,FPGA)和專用集成電路(Application Specific Integrated Circuit,ASIC)4種。由于高端CPU、GPU和FPGA的設計基本上被個別公司所壟斷,近年來出現的大多數新創公司都在開發針對AI加速的ASIC,只有為數不多的新創公司取得了高端CPU、GPU研發的競爭優勢。這個態勢尤其體現在云端(數據中心)的AI訓練芯片上,因為這些芯片需要極高的算力,因而開發芯片的主要目標是“高算力”。

2023—2024年,AI芯片市場上新一代的CPU和GPU仍然是最具競爭力的AI芯片。英特爾(Intel)公司的CPU已經針對AI計算任務做了許多改進,其最新公布的路線圖顯示,在接下來的兩三年內將有更多用于AI處理的高性能CPU產品供數據中心使用。而英特爾的x86處理器早已被非常廣泛地部署在全球各大數據中心里。英偉達的全新架構GPU芯片——英偉達H100和B100芯片具備了驚人的AI性能指標。AMD也推出了新一代的GPU。

在AI模型的開發、訓練和推理中,不同AI芯片的使用比例取決于具體的應用場景、需求和資源預算。圖1.2所示是各種AI芯片在不同處理場合中的應用情況。

圖1.2 各種AI芯片在不同處理場合中的應用情況

(1)在AI模型的開發、訓練和推理中,CPU通常作為整個系統的主要控制單元。近年來,很多CPU增加了AI處理單元,大多數AI任務中CPU的使用比例已經大大上升。

(2)GPU在深度學習中的應用非常廣泛,由于具有強大的并行計算能力,通常被用于大規模數據集的訓練和復雜模型的推理。在這些場景下,GPU的運算速度可以比CPU快100倍。GPU在AI模型開發和訓練中的使用比例為60%~80%,具體取決于模型的大小和訓練的規模。

(3)FPGA是一種靈活的可編程芯片,在AI模型的訓練和推理中也有一定的應用。FPGA可以根據具體需求進行重新編程,適用于一些需要快速迭代和靈活處理的場景。然而,FPGA的配置和優化相對復雜,通常具有較高的技術要求和開發成本。因此,FPGA的使用比例相對較低,通常在10%以下。

(4)ASIC是為特定任務而設計的芯片。在一些高性能計算(High Performance Computing,HPC)需求較密集的場景(如云計算中心)中,一些大規模的AI模型可能會使用ASIC來加速訓練和推理過程,效果非常顯著。然而,ASIC的設計和生產成本較高,并且需要針對具體任務進行定制,因此一般情況下使用比例較低。

AI芯片使用的實際比例會根據具體任務、硬件配置和資源限制等因素而有所不同。此外,隨著技術的發展和芯片的更新,使用比例也可能發生變化。同時,使用比例也會根據應用場景的不同而調整。例如,CPU經常被用于邊緣設備的AI推理,如智能手機和自動駕駛汽車;而在需要高性能和低時延的數據中心,GPU經常被用于AI訓練和推理;FPGA常被用于AI推理的專業應用,如醫療成像和金融交易;ASIC除了被用于一小部分AI訓練,通常被用于對性能要求最高的場景下的AI推理,如自動駕駛和人臉識別等。

對AI推理來說,除了云端推理這類特別復雜的任務,一般的邊緣推理并不需要高算力的AI芯片,而需要高能效(盡可能少耗電)的AI芯片。在這個領域,一些設計新穎、功耗極低的ASIC被不斷開發出來。新創公司及研究機構在該領域有更大的優勢空間。

圖1.3所示為基于深度學習的生成式AI模型中各個層次的組成情況。如果沒有像TensorFlow這樣的框架來為AI算法編程,即使再好的芯片也不能發揮作用。AI芯片制造廠家為每個層次提供了適配的軟件。軟件優化往往可以很大程度地提升速度。

圖1.3 基于深度學習的生成式AI模型中各個層次的組成情況

接下來,首先介紹近些年出現的一些CPU、GPU、FPGA和ASIC的情況,以及它們未來的發展路線圖,其次介紹幾家新創公司開發的AI加速器芯片。

主站蜘蛛池模板: 三河市| 南陵县| 寿宁县| 宁津县| 疏勒县| 宿州市| 鹤壁市| 大关县| 沙湾县| 乌鲁木齐市| 东明县| 锦屏县| 文安县| 铜川市| 西乌珠穆沁旗| 石狮市| 桐庐县| 盖州市| 肃南| 大荔县| 宁陕县| 德惠市| 莫力| 岑溪市| 凌海市| 贞丰县| 肇州县| 射洪县| 靖江市| 南投县| 信阳市| 乌拉特后旗| 陆河县| 长子县| 十堰市| 万宁市| 自贡市| 泽州县| 巴东县| 晋宁县| 苍溪县|