![]() 「香港飛龍」標誌 本文内容: 公衆號記得加星標??,第一時間看推送不會錯過。來源:內容編譯自semiwiki。在Quadric看來,雖然NPU目前發展迅猛,也有不少傳統和新興廠商在這個賽道努力。他們認爲,將矩陣計算與通用計算緊密集成,而不是將兩個不同的引擎焊接到一條總線上,然後再對算法進行劃分,這似乎是一箇顯而易見的優勢。爲什麼一些規模更大、更成熟的 IP 供應商不做類似的事情呢?Quadric的答案總是:“他們不能,因爲他們被自己的成功遺產所困住了!”在“AI 加速器”或“NPU IP”授權市場中,衆多競爭對手從各種各樣的切入點開始提供 NPU 解決方案。五六年前,CPU IP 提供商紛紛加入 NPU 加速器領域,試圖保持其 CPU 的競爭力,他們打出的口號是“使用我們值得信賴的 CPU,將那些繁瑣的、計算量巨大的矩陣運算交給加速器引擎”。DSP IP 提供商也採取了同樣的行動。可配置處理器 IP 供應商也是如此。甚至 GPU IP 授權公司也在做同樣的事情。這些公司的策略非常相似:(1) 稍微調整傳統的指令集,以略微提高 AI 性能;(2) 提供矩陣加速器來處理當時 ML 基準測試中最常見的一二十個圖運算符:Resnet、Mobilenet、VGG。其結果是,所有 10 或 12 家領先的 IP 公司產品中的分區 AI“子系統”看起來非常相似:傳統核心加上硬連線加速器。這些架構的致命缺陷是:總是需要對算法進行分區才能在兩個引擎上運行。只要算法的“分割”數量非常少,這些架構就能在幾年內運行良好。例如,對於 Resnet 基準測試,通常只需要在推理的最後進行一次分區。Resnet 可以在這種傳統架構上非常高效地運行。但是,隨着 Transformer 的出現,它需要一組截然不同且更廣泛的圖運算符,突然間,“加速器”無法加速太多(如果有的話)新模型,整體性能變得無法使用。NPU 加速器產品需要改變。使用硅片的客戶不得不承擔硅片重新流片的成本——非常高昂的成本。如今,這些知識產權授權公司發現自己陷入了困境。五年前,他們決定走一條“捷徑”,尋求短期解決方案,卻最終落入了陷阱。所有傳統知識產權公司之所以選擇這條路,其動機既源於技術需求,也源於人性和企業政治。不到十年前,噹噹時普遍被稱爲“機器學習”的工作負載首次在視覺處理任務中嶄露頭角時,傳統處理器供應商面臨着客戶的需求,他們要求提供靈活的解決方案(處理器),以運行這些快速變化的新算法。由於處理器(CPU、DSP、GPU)無法勝任這些新任務,最快的短期技術解決方案是外部矩陣加速器。而構建一箇長期技術解決方案——一箇專門構建的可編程NPU,能夠處理流行訓練框架中所有2000多箇圖形運算符——則需要更長的時間才能交付,並帶來更大的投資和技術風險。但我們不應忽視這些傳統處理器IP公司所面臨的人性因素。一家選擇構建全新架構(包括新工具鏈/編譯器)的傳統處理器公司,必須在內部和外部明確聲明,該傳統產品與現代人工智能世界的關係,遠不如之前的傳統IP核(CPU、DSP、GPU)的價值。目前承擔所有家庭開支的養家餬口者,需要支付新架構編譯器工程師團隊的工資,而新架構實際上與傳統的明星IP競爭。(這是“ 創新者窘境” 問題的變體。)客戶也必須適應新的、混雜的信息,這些信息宣稱“之前普遍出色的IP覈實際上只適用於部分應用——但你卻得不到專利費折扣。”所有傳統公司都選擇了同一條路:將矩陣加速器固定在搖錢樹處理器上,並宣稱傳統核心仍然佔據主導地位。三年後,面對Transformer的現實,他們宣佈第一代加速器已過時,併發明瞭第二代,但第二代加速器重複了第一代加速器的缺點。如今,面對算 子的持續演進(自注意力、多頭自注意力、屏蔽自注意力以及每天都有新的算子出現),第二代硬連線加速器也面臨困境,它們要麼再次加倍努力,說服內部和外部利益相關者,這第三次固定功能加速器將永遠解決所有問題;要麼承認他們需要打破自己構建的壁壘,構建一箇真正可編程的專用AI處理器。*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4063期內容,歡迎關注。加星標??第一時間看推送,小號防走丟求推薦 (本文内容不代表本站观点。) --------------------------------- |