華爲達芬奇與英偉達CUDA架構對比分析

薪科技快評 2024-06-29 09:29:06

華爲達芬奇與英偉達CUDA,必有一戰!

大數據産業創新服務媒體

——聚焦數據 · 改變商業

當初英特爾和微軟,搞出來個Wintel,制霸電腦時代很多年。從某種意義上,英偉達的CUDA,就相當于CPU時代的windows,承擔了構建應用生態的重任。而生態的壁壘,是比芯片性能更深厚的競爭壁壘。所以,CUDA才是英偉達最大的王牌。在CPU時代,我們被Wintel壓制了很多年。在AI時代,英偉達集GPU和CUDA于一身,會是另一個難以打破的Wintel麽?目前看是的。

由于美國對中國AI産業的打壓,芯片這張牌被用的越來越頻繁。不僅美國政府,就是英偉達自身處于商業競爭的考慮,也越來越傾向于“打牌”。而CUDA,就是英偉達最大的王牌。中國要在AI計算領域突破封鎖,不僅要有自己的GPU,也要有自己的CUDA。要做成這件事情,目前來看,似乎只有靠華爲了。CUDA才是英偉達最深的護城河

在圖形渲染的世界中,英偉達以其精湛的GPU技術贏得了市場的青睐。然而,英偉達並未止步于此,它的目光早已超越了圖形渲染的邊界,投向了更爲廣闊的計算領域。2006年,英偉達推出了CUDA(Compute Unified Device Architecture),這一舉措標志著英偉達從圖形渲染巨頭向計算巨頭的華麗轉身。

CUDA的發展曆程中,有幾個關鍵節點:2007年:CUDA 1.0的發布,開放了GPU的通用計算能力,爲開發者提供了進入GPU編程世界的鑰匙。2008年:CUDA 2.0增加了對雙精度浮點運算的支持,這對于科學計算和工程模擬等領域至關重要。

2010年:CUDA 3.0進一步擴展了GPU的並行處理能力,爲更複雜的計算任務提供了支持。2012年:CUDA 5.0引入了動態並行性,允許GPU內核自我複制,極大地提升了程序的靈活性和效率。

這些版本不僅推動了CUDA技術的進步,也成爲了GPU並行計算發展史上的重要裏程碑。

CUDA的核心在于其創新的並行計算模型,通過將計算任務分解爲成千上萬的線程,CUDA能夠在GPU上實現前所未有的並行處理能力。這種模型不僅極大地提高了計算效率,也使得GPU成爲了解決複雜計算問題的理想平台。

從深度學習到科學模擬,CUDA定義了並行計算的新紀元,開啓了高性能計算的新篇章。隨著AI和大數據的興起,CUDA的市場影響力不斷擴大。開發者們紛紛轉向CUDA,以利用GPU的強大計算能力來加速他們的應用程序。

企業也認識到了CUDA的價值,將其作爲提升産品性能和競爭力的關鍵技術。根據統計數據,CUDA的下載量已經超過了3300萬次。對于英偉達而言,CUDA已經成爲英偉達最深的護城河。它不僅鞏固了英偉達在GPU市場的領導地位,更爲英偉達打開了進入高性能計算、深度學習、自動駕駛等多個前沿領域的大門。

隨著技術的不斷進步和市場的不斷擴大,CUDA無疑將繼續扮演著英偉達最深護城河的角色,引領著計算技術的未來。比CUDA晚了12年的達芬奇架構,能撐得起華爲的AI野心麽?

達芬奇架構,作爲華爲自研的AI計算架構,其起源與華爲對AI未來應用的深遠洞察密切相關。早在幾年前,華爲就預測到2025年,全球智能終端的數量將達到400億台,智能助理的普及率將達到90%,企業數據的使用率將達到86%。

基于這樣的預測,華爲在2018年全聯接大會上提出全棧全場景AI戰略,並設計了達芬奇計算架構,以在不同體積和功耗條件下提供強勁的AI算力。達芬奇架構的發展可以追溯到2018年,華爲推出的AI芯片Ascend 310(昇騰310)首次亮相,標志著達芬奇架構的正式應用。緊接著,華爲在2019年6月發布了全新8系列手機SoC芯片麒麟810,首次采用達芬奇架構NPU,實現了業界領先的端側AI算力。

麒麟810在AI Benchmark榜單中表現卓越,證明了達芬奇架構的實力。達芬奇架構是專爲AI計算特征而設計的全新計算架構,具備高算力、高能效、靈活可裁剪的特性。其核心優勢在于采用3D Cube針對矩陣運算做加速,每個AI Core可以在一個時鍾周期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。此外,達芬奇架構還集成了向量、標量、硬件加速器等多種計算單元,並支持多種精度計算,支撐訓練和推理兩種場景的數據精度要求。

達芬奇架構的應用領域廣泛,覆蓋了從端側到雲端的全場景AI應用。在端側,麒麟810芯片的AI算力已經在智能手機中得到應用,爲消費者提供了豐富的AI應用體驗。在邊緣側和雲端,Ascend系列AI處理器可以滿足從幾十毫瓦到幾百瓦的訓練場景,提供最優的AI算力。達芬奇架構的靈活性和高效性,使其在智慧城市、自動駕駛、工業制造等多個領域中發揮著重要作用。

誠然,達芬奇架構在華爲的AI市場布局中占據了核心的位置。它不僅是華爲AI芯片的技術基礎,也是華爲實現全棧全場景AI戰略的重要支撐。通過達芬奇架構,華爲能夠提供從硬件到軟件的全棧AI解決方案,加速AI技術的産業化和應用落地。此外,達芬奇架構的統一性也爲開發者帶來了便利,降低了開發和遷移成本,促進了AI應用的創新和發展。

達芬奇VS CUDA,有幾分勝算?

相比于2006年推出的CUDA,華爲達芬奇要晚了12個年頭。這12年中,達芬奇一直在追趕。除了時間上的差距,達芬奇和CUDA還在架構設計哲學、性能表現、工具鏈、開發者生態等多個層面存在顯著的差異。

在設計哲學方面,CUDA是英偉達開發的並行計算平台和API模型,它允許開發者使用NVIDIA的GPU進行高效的並行計算。而達芬奇架構是華爲自研的面向AI計算特征的全新計算架構,它采用了3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力。

CUDA的設計更注重通用性,而達芬奇則專注于AI計算的高效性。在AI計算性能方面,CUDA和達芬奇各有千秋。CUDA憑借多年的技術積累,支持大規模並行處理能力,適合處理各種複雜的計算任務。達芬奇架構則通過其3D Cube計算引擎,針對矩陣運算進行優化,實現了在單位面積下的AI算力顯著提升。

在深度學習等AI應用場景中,達芬奇架構展現出了優秀的性能表現。CUDA和達芬奇架構在不同領域下的適用性各有側重,CUDA由于其通用性,被廣泛應用于科學研究、醫學、金融等多個領域。而達芬奇架構則主要針對AI計算,特別是在端側、邊緣側及雲端的AI應用場景中,如智能手機、自動駕駛、雲業務等。

從開發者的角度來看,CUDA和達芬奇架構在編程模型與工具鏈的易用性上有所不同。CUDA提供了一套完整的開發工具鏈,包括CUDA編譯器、調試器、性能分析工具等,支持多種編程語言和深度學習框架。達芬奇架構雖然起步較晚,但華爲也在積極構建其工具鏈和開發者生態,提供必要的支持以促進開發者的使用和創新。但從工具鏈的完整性和豐富度來看,達芬奇離CUDA還有不少的差距。CUDA通過其廣泛的應用和成熟的技術,已經建立了一個龐大的開發者社區和生態系統。而生態的建設,是比單純提升GPU性能更難得事情,這才是對華爲真正的考驗。

華爲GPU快成了,但離構建自己的CUDA還很遙遠

目前看,華爲GPU發展態勢較好。根據公開信息,2023年華爲算力GPU的出貨量大約爲十萬片。隨著産能的增加,預計到2024年,這個數字將翻幾番,達到幾十萬片的規模。盡管産能有所提升,市場上的訂單需求依然非常旺盛,僅在2024年1月份的下單量就已經達到了數十萬片。

目前,下單需求已經達到上百萬片,遠超華爲當前的供應能力。在國內購買情況方面,華爲算力GPU受到了市場的熱烈追捧。華爲算力GPU的客戶主要分爲三個梯隊:第一類是三大運營商和政務類客戶,第二類是互聯網客戶,第三類是其他公司。由于算力GPU的緊缺,客戶爲了盡快拿到産品,都在努力成爲第一梯隊的客戶,甚至采取與地方政府合作等措施以確保優先供應。

價格方面,華爲算力GPU自2023年8月上市以來,價格已經經曆了至少兩次提價。最初上市的價格約爲7萬元人民幣,而目前市場價格已經上漲至約12萬元人民幣。總體來看,華爲GPU的發展態勢良好,市場需求強勁,盡管供應緊張,但這也反映出華爲GPU在性能和國産化方面的優勢,使其成爲市場中的熱門選擇。

隨著技術的不斷進步和産能的進一步提升,預計華爲GPU將在未來市場中占據更重要的位置。在一次專訪中,黃仁勳表示:“華爲是個好公司”。

此外,英偉達在財報中將華爲列爲主要競爭對手,這反映了華爲在GPU及相關技術領域的競爭力正在增強。盡管華爲GPU發展態勢良好,但CUDA作爲GPU領域占主導地位的框架,其生態系統的成熟度和廣泛接受度遠遠超過了其他框架,包括AMD開發的框架。

華爲的AI計算框架在生態建設方面確實還有很長的路要走,需要持續的技術創新和市場推廣才能逐步構建起與CUDA相匹敵的生態系統。然而,英偉達不想給華爲成長起來的時間了。

近期,英偉達對其CUDA平台的兼容性政策進行了調整,限制了CUDA軟件在非英偉達硬件平台上的運行行爲,這一決策始于2021年,並在隨後的時間裏逐步加強。具體來說,英偉達通過更新其最終用戶許可協議(EULA),明確禁止了使用轉換層或模擬層在非英偉達GPU上運行CUDA代碼的行爲。

這一政策變動主要影響了那些試圖通過轉譯技術實現CUDA兼容性的第三方項目,例如ZLUDA等。ZLUDA是一個允許在非英偉達硬件上運行CUDA程序的轉譯庫,它提供了一種相對簡單的方式,使得開發者能夠在性能略有損失的情況下,運行CUDA程序。英偉達此舉,被廣泛認爲是保護其市場份額和維護其技術控制權的戰略舉措。

通過限制在其他芯片上使用CUDA軟件的方式,英偉達確保其GPU仍然是開發人員和依賴其並行計算平台的企業的首選。然而,這一決策在業界引起了不小的震動,並引發了廣泛的討論。不少人指責英偉達借助封鎖政策壟斷市場,壓制競爭對手的發展機會。

面對英偉達的限制政策,一些國內GPU企業如摩爾線程選擇了遵守EULA規定,並表態采用重新編譯代碼的方式與EULA保持一致,以避免違反英偉達的限制條款。此外,業界其他力量,包括AMD、英特爾等廠商,並未因英偉達的限制而止步,他們正在積極推動開放、可移植的生態系統建設,以試圖打破英偉達的市場壟斷。面對英偉達的出牌,華爲在發展自己的GPU技術時,需要更多地依賴自主研發的軟件工具和開發環境,而不是依賴于CUDA這樣的成熟平台。

這意味著華爲需要投入更多的資源來構建自己的軟件生態系統,包括開發與CUDA性能相匹敵的編程工具、庫和API。可以預見,在未來較長一段時間內,由于CUDA的廣泛使用和對高性能計算、AI等領域的深遠影響,英偉達的這一政策可能會限制華爲GPU的市場接受度,特別是在那些已經深度依賴于CUDA的領域。這加強了華爲構建自身AI計算架構和AI生態的緊迫性,就像當初安卓斷供成就了鴻蒙一樣,CUDA的收緊會否成爲華爲達芬奇架構的神助攻呢?

-對此,您有什麽看法見解?-

-歡迎在評論區留言探討和分享。-

2 阅读:883
评论列表
  • 2024-06-29 17:08

    不管好不好,國內就華爲這根獨苗。而且這也只能靠華爲,其他公司大多數都是騙補的。就跟操作系統一樣,國內搞了幾十年,最後也就華爲能成。

    禁衛 回覆:
    華爲沒有別人授權,基本就沒有什麽自研。遙遙領先那是一流。
  • 2024-06-30 08:59

    在怎麽打破他都是米國的,中國破不破才是關鍵。

  • 2024-07-02 12:10

    還好中國有一個華爲,可惜中國只有一個華爲。

  • 2024-07-03 09:43

    [哭笑不得][哭笑不得][哭笑不得]怎麽說呢,英偉達的cuda是開源的,依托廣大的程序員和愛好者推廣發展,而華爲的達芬奇架構相對閉源,最主要依靠自己的發展,各有各的好處

薪科技快評

簡介:薪科技評說,發現技術的點滴,記錄科學的飛躍!