NVIDIA成為首家「兆元俱樂部」晶片大廠 一文看懂輝達為何能獨領風騷!
在最近的人工智慧浪潮中,輝達(Nvidia Corporation)無疑是站在風口浪尖的一家公司,最近的表現甚至壓過了ChatGPT的東家微軟(Microsoft)。而NVIDIA之所以能獨領風騷,關鍵原因就是其備受人工智慧領域追捧的晶片,自從ChatGPT掀起「生成式人工智慧」的熱潮後,NVIDIA的A100Tensor Core GPU及更高一代的H100 Tensor Core GPU,便成為市場搶購的熱門產品,目前這些高端晶片及相應的顯卡已是一卡難求。綜合《財聯社》、BBC、CNBC的報導,近期AI概念股大熱,帶頭的NVIDIA漲勢不停,美東時間30日早盤開盤後,NVIDIA股價再飆近5%,市值正式突破1兆美元大關,雖然隨後又回吐漲幅,跌至9900億美元,但NVIDIA還是成為了第一家進入「兆元俱樂部」的晶片大廠。在30日開盤前,輝達的股價今年來已上漲166.5%。微軟亞洲高級研究員張弋近期在Podcast節目中感嘆,現在居然到了整個地球都拿不出足夠的A100晶片的奇怪場景,一年前,幾乎沒人能料到這一情形。而人工智慧領域的初創公司CoreWeave創始人兼首席執行官Brannin McBee更驚嘆,「H100是地球上最稀缺的工程資源之一」,這句話足以讓人理解NVIDIA的盛況。但令人好奇的是,為何只有NVIDIA的晶片能成為人工智慧領域獨一無二的玩家?而這家過去在顯卡稱霸的公司,又為何能在深度學習和人工智慧領域傲視群雄?1999年,初出茅蘆的NVIDIA首次推出了圖形處理器(GPU)這一概念。在此之前,包括英特爾(Intel Corporation)在內負責開發中央處理器(CPU)的公司都堅信圖形處理是CPU的事情,CPU幹的事越多越好,將圖形工作獨立到另一附屬處理器上的想法十分沒意義。此外,當時的圖形應用領域中又以搞遊戲的日本廠商話語權最重。日系主機的CPU很強,大部分開發工作都集中於CPU之上,因此GPU並沒有獲得多少市場青睞。不過,不服氣的微軟當時想要衝擊屬於日本廠商的行業領先地位,於是開發出了Direct X這一專為多媒體以及遊戲開發的標準化API圖形介面,此後大量的圖形功能從CPU裡面移植出來,轉到GPU之上。加上微軟另一產品Xbox的推出,其CPU、GPU各司其職的搭配,打破了行業內CPU晶片一家獨大的局面。而NVIDIA就是當年在硬體領域中少數幾家跟隨微軟腳步前進的公司。此後,微軟又推動了新的變革,引入統一著色器模型(Unified shader model),即GPU中一種著色器硬體形式。統一著色器只是圖形應用上的一步,但卻給NVIDIA帶來完全不同的發展路線,可以說是NVIDIA耕耘GPU,以及深度學習領域發展中的重要起點。在看到統一著色器模型後,NVIDIA果斷的把自己以前的GPU架構打掉重練。其GPU流處理器(Streamprocessor)被進行了細緻的分組,變成一個個小型流處理器且能單獨運行,解決了流處理器此前被綁定無法獨立運行而被迫閒置的問題。這奠定了NVIDIA後來革命性的統一計算架構(CUDA)的出世,透過此項技術,使用者可利用NVIDIA的GPU進行圖像處理之外的運算。由於NVIDIA的流處理器是很獨立且標準的單元,極易控制和調度,這讓原本只能連續處理的任務可以被並行處理,使程式設計難度大大降低。與此同時,NVIDIA的競爭對手冶天科技(ATI Technologies Inc.)卻因為早期沒有投入硬體架構變革,還是沿用過去的串列設計,導致沉沒成本(Sunk Cost)越來越高,最後便直接被NVIDIA擠出顯卡市場。此後,NVIDIA又在2017年引入了突破性創新技術Tensor Core計算單元概念,其專門為深度學習而設計,支持更低精度的運算,從而大幅節省了模型算力,並將NVIDIA的GPU變成高效率又多功能的人工智慧處理器。這一專用的加速單元很大程度上排擠了CUDA處理深度學習的空間,但也同時打了NVIDIA的競爭對手一個措手不及,讓AI專用晶片不再吸引人。於是,NVIDIA的GPU就在因緣際會之下成為AI領域最被認可的硬體。事實上,當AI爆紅後,行業內的企業才無奈發現,GPU是簡單高效運行生成式AI模型的最好選擇,一個本用來玩遊戲的GPU不太可能切換去跑AI程式,但NVIDIA的GPU就是做到了!