華爲達芬奇與英偉達CUDA架構對比分析

華爲達芬奇與英偉達CUDA，必有一戰！

大數據産業創新服務媒體

——聚焦數據 · 改變商業

當初英特爾和微軟，搞出來個Wintel，制霸電腦時代很多年。從某種意義上，英偉達的CUDA，就相當于CPU時代的windows，承擔了構建應用生態的重任。而生態的壁壘，是比芯片性能更深厚的競爭壁壘。所以，CUDA才是英偉達最大的王牌。在CPU時代，我們被Wintel壓制了很多年。在AI時代，英偉達集GPU和CUDA于一身，會是另一個難以打破的Wintel麽？目前看是的。

由于美國對中國AI産業的打壓，芯片這張牌被用的越來越頻繁。不僅美國政府，就是英偉達自身處于商業競爭的考慮，也越來越傾向于“打牌”。而CUDA，就是英偉達最大的王牌。中國要在AI計算領域突破封鎖，不僅要有自己的GPU，也要有自己的CUDA。要做成這件事情，目前來看，似乎只有靠華爲了。CUDA才是英偉達最深的護城河

在圖形渲染的世界中，英偉達以其精湛的GPU技術贏得了市場的青睐。然而，英偉達並未止步于此，它的目光早已超越了圖形渲染的邊界，投向了更爲廣闊的計算領域。2006年，英偉達推出了CUDA（Compute Unified Device Architecture），這一舉措標志著英偉達從圖形渲染巨頭向計算巨頭的華麗轉身。

CUDA的發展曆程中，有幾個關鍵節點：2007年：CUDA 1.0的發布，開放了GPU的通用計算能力，爲開發者提供了進入GPU編程世界的鑰匙。2008年：CUDA 2.0增加了對雙精度浮點運算的支持，這對于科學計算和工程模擬等領域至關重要。

2010年：CUDA 3.0進一步擴展了GPU的並行處理能力，爲更複雜的計算任務提供了支持。2012年：CUDA 5.0引入了動態並行性，允許GPU內核自我複制，極大地提升了程序的靈活性和效率。

這些版本不僅推動了CUDA技術的進步，也成爲了GPU並行計算發展史上的重要裏程碑。

CUDA的核心在于其創新的並行計算模型，通過將計算任務分解爲成千上萬的線程，CUDA能夠在GPU上實現前所未有的並行處理能力。這種模型不僅極大地提高了計算效率，也使得GPU成爲了解決複雜計算問題的理想平台。

從深度學習到科學模擬，CUDA定義了並行計算的新紀元，開啓了高性能計算的新篇章。隨著AI和大數據的興起，CUDA的市場影響力不斷擴大。開發者們紛紛轉向CUDA，以利用GPU的強大計算能力來加速他們的應用程序。

企業也認識到了CUDA的價值，將其作爲提升産品性能和競爭力的關鍵技術。根據統計數據，CUDA的下載量已經超過了3300萬次。對于英偉達而言，CUDA已經成爲英偉達最深的護城河。它不僅鞏固了英偉達在GPU市場的領導地位，更爲英偉達打開了進入高性能計算、深度學習、自動駕駛等多個前沿領域的大門。

隨著技術的不斷進步和市場的不斷擴大，CUDA無疑將繼續扮演著英偉達最深護城河的角色，引領著計算技術的未來。比CUDA晚了12年的達芬奇架構，能撐得起華爲的AI野心麽？

達芬奇架構，作爲華爲自研的AI計算架構，其起源與華爲對AI未來應用的深遠洞察密切相關。早在幾年前，華爲就預測到2025年，全球智能終端的數量將達到400億台，智能助理的普及率將達到90%，企業數據的使用率將達到86%。

基于這樣的預測，華爲在2018年全聯接大會上提出全棧全場景AI戰略，並設計了達芬奇計算架構，以在不同體積和功耗條件下提供強勁的AI算力。達芬奇架構的發展可以追溯到2018年，華爲推出的AI芯片Ascend 310（昇騰310）首次亮相，標志著達芬奇架構的正式應用。緊接著，華爲在2019年6月發布了全新8系列手機SoC芯片麒麟810，首次采用達芬奇架構NPU，實現了業界領先的端側AI算力。

麒麟810在AI Benchmark榜單中表現卓越，證明了達芬奇架構的實力。達芬奇架構是專爲AI計算特征而設計的全新計算架構，具備高算力、高能效、靈活可裁剪的特性。其核心優勢在于采用3D Cube針對矩陣運算做加速，每個AI Core可以在一個時鍾周期內實現4096個MAC操作，相比傳統的CPU和GPU實現數量級的提升。此外，達芬奇架構還集成了向量、標量、硬件加速器等多種計算單元，並支持多種精度計算，支撐訓練和推理兩種場景的數據精度要求。

達芬奇架構的應用領域廣泛，覆蓋了從端側到雲端的全場景AI應用。在端側，麒麟810芯片的AI算力已經在智能手機中得到應用，爲消費者提供了豐富的AI應用體驗。在邊緣側和雲端，Ascend系列AI處理器可以滿足從幾十毫瓦到幾百瓦的訓練場景，提供最優的AI算力。達芬奇架構的靈活性和高效性，使其在智慧城市、自動駕駛、工業制造等多個領域中發揮著重要作用。

誠然，達芬奇架構在華爲的AI市場布局中占據了核心的位置。它不僅是華爲AI芯片的技術基礎，也是華爲實現全棧全場景AI戰略的重要支撐。通過達芬奇架構，華爲能夠提供從硬件到軟件的全棧AI解決方案，加速AI技術的産業化和應用落地。此外，達芬奇架構的統一性也爲開發者帶來了便利，降低了開發和遷移成本，促進了AI應用的創新和發展。

達芬奇VS CUDA，有幾分勝算？

相比于2006年推出的CUDA，華爲達芬奇要晚了12個年頭。這12年中，達芬奇一直在追趕。除了時間上的差距，達芬奇和CUDA還在架構設計哲學、性能表現、工具鏈、開發者生態等多個層面存在顯著的差異。

在設計哲學方面，CUDA是英偉達開發的並行計算平台和API模型，它允許開發者使用NVIDIA的GPU進行高效的並行計算。而達芬奇架構是華爲自研的面向AI計算特征的全新計算架構，它采用了3D Cube針對矩陣運算做加速，大幅提升單位功耗下的AI算力。

CUDA的設計更注重通用性，而達芬奇則專注于AI計算的高效性。在AI計算性能方面，CUDA和達芬奇各有千秋。CUDA憑借多年的技術積累，支持大規模並行處理能力，適合處理各種複雜的計算任務。達芬奇架構則通過其3D Cube計算引擎，針對矩陣運算進行優化，實現了在單位面積下的AI算力顯著提升。

在深度學習等AI應用場景中，達芬奇架構展現出了優秀的性能表現。CUDA和達芬奇架構在不同領域下的適用性各有側重，CUDA由于其通用性，被廣泛應用于科學研究、醫學、金融等多個領域。而達芬奇架構則主要針對AI計算，特別是在端側、邊緣側及雲端的AI應用場景中，如智能手機、自動駕駛、雲業務等。

從開發者的角度來看，CUDA和達芬奇架構在編程模型與工具鏈的易用性上有所不同。CUDA提供了一套完整的開發工具鏈，包括CUDA編譯器、調試器、性能分析工具等，支持多種編程語言和深度學習框架。達芬奇架構雖然起步較晚，但華爲也在積極構建其工具鏈和開發者生態，提供必要的支持以促進開發者的使用和創新。但從工具鏈的完整性和豐富度來看，達芬奇離CUDA還有不少的差距。CUDA通過其廣泛的應用和成熟的技術，已經建立了一個龐大的開發者社區和生態系統。而生態的建設，是比單純提升GPU性能更難得事情，這才是對華爲真正的考驗。

華爲GPU快成了，但離構建自己的CUDA還很遙遠

目前看，華爲GPU發展態勢較好。根據公開信息，2023年華爲算力GPU的出貨量大約爲十萬片。隨著産能的增加，預計到2024年，這個數字將翻幾番，達到幾十萬片的規模。盡管産能有所提升，市場上的訂單需求依然非常旺盛，僅在2024年1月份的下單量就已經達到了數十萬片。

目前，下單需求已經達到上百萬片，遠超華爲當前的供應能力。在國內購買情況方面，華爲算力GPU受到了市場的熱烈追捧。華爲算力GPU的客戶主要分爲三個梯隊：第一類是三大運營商和政務類客戶，第二類是互聯網客戶，第三類是其他公司。由于算力GPU的緊缺，客戶爲了盡快拿到産品，都在努力成爲第一梯隊的客戶，甚至采取與地方政府合作等措施以確保優先供應。

價格方面，華爲算力GPU自2023年8月上市以來，價格已經經曆了至少兩次提價。最初上市的價格約爲7萬元人民幣，而目前市場價格已經上漲至約12萬元人民幣。總體來看，華爲GPU的發展態勢良好，市場需求強勁，盡管供應緊張，但這也反映出華爲GPU在性能和國産化方面的優勢，使其成爲市場中的熱門選擇。

隨著技術的不斷進步和産能的進一步提升，預計華爲GPU將在未來市場中占據更重要的位置。在一次專訪中，黃仁勳表示：“華爲是個好公司”。

此外，英偉達在財報中將華爲列爲主要競爭對手，這反映了華爲在GPU及相關技術領域的競爭力正在增強。盡管華爲GPU發展態勢良好，但CUDA作爲GPU領域占主導地位的框架，其生態系統的成熟度和廣泛接受度遠遠超過了其他框架，包括AMD開發的框架。

華爲的AI計算框架在生態建設方面確實還有很長的路要走，需要持續的技術創新和市場推廣才能逐步構建起與CUDA相匹敵的生態系統。然而，英偉達不想給華爲成長起來的時間了。

近期，英偉達對其CUDA平台的兼容性政策進行了調整，限制了CUDA軟件在非英偉達硬件平台上的運行行爲，這一決策始于2021年，並在隨後的時間裏逐步加強。具體來說，英偉達通過更新其最終用戶許可協議（EULA），明確禁止了使用轉換層或模擬層在非英偉達GPU上運行CUDA代碼的行爲。

這一政策變動主要影響了那些試圖通過轉譯技術實現CUDA兼容性的第三方項目，例如ZLUDA等。ZLUDA是一個允許在非英偉達硬件上運行CUDA程序的轉譯庫，它提供了一種相對簡單的方式，使得開發者能夠在性能略有損失的情況下，運行CUDA程序。英偉達此舉，被廣泛認爲是保護其市場份額和維護其技術控制權的戰略舉措。

通過限制在其他芯片上使用CUDA軟件的方式，英偉達確保其GPU仍然是開發人員和依賴其並行計算平台的企業的首選。然而，這一決策在業界引起了不小的震動，並引發了廣泛的討論。不少人指責英偉達借助封鎖政策壟斷市場，壓制競爭對手的發展機會。

面對英偉達的限制政策，一些國內GPU企業如摩爾線程選擇了遵守EULA規定，並表態采用重新編譯代碼的方式與EULA保持一致，以避免違反英偉達的限制條款。此外，業界其他力量，包括AMD、英特爾等廠商，並未因英偉達的限制而止步，他們正在積極推動開放、可移植的生態系統建設，以試圖打破英偉達的市場壟斷。面對英偉達的出牌，華爲在發展自己的GPU技術時，需要更多地依賴自主研發的軟件工具和開發環境，而不是依賴于CUDA這樣的成熟平台。

這意味著華爲需要投入更多的資源來構建自己的軟件生態系統，包括開發與CUDA性能相匹敵的編程工具、庫和API。可以預見，在未來較長一段時間內，由于CUDA的廣泛使用和對高性能計算、AI等領域的深遠影響，英偉達的這一政策可能會限制華爲GPU的市場接受度，特別是在那些已經深度依賴于CUDA的領域。這加強了華爲構建自身AI計算架構和AI生態的緊迫性，就像當初安卓斷供成就了鴻蒙一樣，CUDA的收緊會否成爲華爲達芬奇架構的神助攻呢？

-對此，您有什麽看法見解？-

-歡迎在評論區留言探討和分享。-

用戶17xxx38 17

2024-06-29 17:08

不管好不好，國內就華爲這根獨苗。而且這也只能靠華爲，其他公司大多數都是騙補的。就跟操作系統一樣，國內搞了幾十年，最後也就華爲能成。

禁衛回覆:

華爲沒有別人授權，基本就沒有什麽自研。遙遙領先那是一流。

06-30 07:00
澀風丶 1

2024-06-30 08:59

在怎麽打破他都是米國的，中國破不破才是關鍵。
簡單點 1

2024-07-02 12:10

還好中國有一個華爲，可惜中國只有一個華爲。
此賬號已注銷 1

2024-07-03 09:43

[哭笑不得][哭笑不得][哭笑不得]怎麽說呢，英偉達的cuda是開源的，依托廣大的程序員和愛好者推廣發展，而華爲的達芬奇架構相對閉源，最主要依靠自己的發展，各有各的好處

娛樂新聞吧

華爲達芬奇與英偉達CUDA架構對比分析

薪科技快評