軟體吞噬硬體的 AI 時代,晶片跟不上演算法的進化要怎麼辦?
作者 品玩 | 發布日期 2021 年 02 月 23 日 8:00 |
身為 AI 時代的幕後英雄,晶片業正經歷漸進持續的變化。
2008 年之後,深度學習演算法逐漸興起,各種神經網絡滲透到手機、App 和物聯網。同時摩爾定律卻逐漸放緩。摩爾定律雖然叫定律,但不是物理定律或自然定律,而是半導體業發展的觀察或預測,內容為:單晶片整合度(積體電路中晶體管的密度)每 2 年(也有 18 個月之說)翻倍,帶來性能每 2 年提高 1 倍。
保證摩爾定律的前提,是晶片製程進步。經常能在新聞看到的 28 奈米、14 奈米、7 奈米、5 奈米,指的就是製程,數字越小製程越先進。隨著製程的演進,特別進入10 奈米後,逐漸逼近物理極限,難度越發增加,晶片全流程設計成本大幅增加,每代較上一代至少增加 30%~50%。
這就導致 AI 對算力需求的增長速度,遠超過通用處理器算力的增長速度。據 OpenAI 測算,從 2012 年開始,全球 AI 所用的演算量呈現等比級數增長,平均每 3.4 個月便會翻 1 倍,通用處理器算力每 18 個月至 2 年才翻 1 倍。
當通用處理器算力跟不上 AI 演算法發展,針對 AI 演算的專用處理器便誕生了,也就是常說的「AI 晶片」。目前 AI 晶片的技術內涵豐富,從架構創新到先進封裝,再到模擬大腦,都影響 AI 晶片走向。這些變化的背後,都有共同主題:以更低功耗,產生更高性能。
更靈活
2017 年圖靈獎頒給電腦架構兩位先驅 David Petterson 和 John Hennessy。2018 年圖靈獎演講時,他們聚焦於架構創新主題,指出演算體系結構正迎來新的黃金 10 年。正如他們所判斷,AI 晶片不斷出現新架構,比如英國 Graphcore 的 IPU──迥異於 CPU 和 GPU 的 AI 專用智慧處理器,已逐漸被業界認可,並 Graphcore 也獲得微軟和三星的戰略投資支援。
名為 CGRA 的架構在學界和工業界正受到越來越多關注。CGRA 全稱 Coarse Grained Reconfigurable Array(粗顆粒可重構陣列),是「可重構計算」理念的落地產物。
據《可重構計算:軟體可定義的計算引擎》一文介紹,理念最早出現在 1960 年代,由加州大學洛杉磯分校的 Estrin 提出。由於太過超前時代,直到 40 年後才獲得系統性研究。加州大學柏克萊分校的 DeHon 等將可重構計算定義為具以下特徵的體系結構:製造後晶片功能仍可客製,形成加速特定任務的硬體功能;演算功能的實現,主要依靠任務到晶片的空間映射。
簡言之,可重構晶片強調靈活性,製造後仍可透過程式語言調整,適應新演算法。形成高度對比的是 ASIC(application-specific integrated circuit,專用積體電路)。ASIC 晶片雖然性能高,卻缺乏靈活性,往往是針對單一應用或演算法設計,難以相容新演算法。
2017 年,美國國防部高級研究計劃局(Defence Advanced Research Projects Agency,DARPA)提出電子產業復興計劃(Electronics Resurgence Initiative,ERI),任務之一就是「軟體定義晶片」,打造接近 ASIC 性能、同時不犧牲靈活性。
照重構時的顆粒分別,可重構晶片可分為 CGRA 和 FPGA(field-programmable gate array,現場可程式語言邏輯門陣列)。FPGA 在業界有一定規模應用,如微軟將 FPGA 晶片帶入大型資料中心,用於加速 Bing 搜索引擎,驗證 FPGA 靈活性和演算法可更新性。但 FPGA 有局限性,不僅性能和 ASIC 有較大差距,且重程式語言門檻比較高。
CGRA 由於實現原理差異,比 FPGA 能做到更底層程式的重新設計,面積效率、能量效率和重構時間都更有優勢。可說 CGRA 同時整合通用處理器的靈活性和 ASIC 的高性能。
隨著 AI 演算逐漸從雲端下放到邊緣端和 IoT 設備,不僅演算法多樣性日益增強,晶片更零碎化,且保證低功耗的同時,也要求高性能。在這種場景下,高能效高靈活性的 CGRA 大有用武之地。
由於結構不統一、程式語言和編譯工具不成熟、易用性不夠友善,CGRA 未被業界廣泛使用,但已可看到一些嘗試。早在 2016 年,英特爾便將 CGRA 納入 Xeon 處理器。三星也曾嘗試將 CGRA 整合到 8K 電視和 Exynos 晶片。
中國清微智慧 2019 年 6 月量產全球首款 CGRA 語音晶片 TX210,同年 9 月又發表全球首款 CGRA 多模態晶片 TX510。這家公司脫胎於清華大學魏少軍教授起頭的可重構計算研究團隊,從 2006 年起就進行相關研究。據芯東西 2020 年 11 月報導,語音晶片 TX210 已出貨數百萬顆,多模組晶片 TX510 在 11 月也出貨 10 萬顆以上,主要客戶為智慧門鎖、安防和臉部支付相關廠商。
先進封裝上位
如開篇提到,由於製程逼近物理極限,摩爾定律逐漸放緩。同時 AI 演算法的進步,對算力需求增長迅猛,逼迫晶片業在先進製程之外探索新方向,之一便是先進封裝。
「在大數據和認知計算時代,先進封裝技術正在發揮比以往更大的作用。AI 發展對高效能、高吞吐量互連的需求,正透過先進封裝技術加速發展來滿足。 」世界第三大晶圓代工廠格羅方德平台首席技術專家 John Pellerin 聲明表示。
先進封裝是相對於傳統封裝的技術。封裝是晶片製造的最後一步:將製作好的晶片器件放入外殼,並與外界器件相連。傳統封裝的封裝效率低,有很大改良空間,而先進封裝技術致力提高整合密度。
先進封裝有很多技術分支,其中 Chiplet(小晶片/芯粒)是最近 2 年的大熱門。所謂「小晶片」,是相對傳統晶片製造方法而言。傳統晶片製造方法,是在同一塊矽晶片上,用同一種製程打造晶片。Chiplet 是將一塊完整晶片的複雜功能分解,儲存、計算和訊號處理等功能模組化成裸晶片(Die)。這些裸晶片可用不同製程製造,甚至可是不同公司提供。透過連接介面相接後,就形成一個 Chiplet 晶片網路。
據壁仞科技研究院唐杉分析,Chiplet 歷史更久且更準確的技術詞彙應該是異構整合(Heterogeneous Integration)。總體來說,此技術趨勢較清晰明確,且第一階段 Chiplet 形態技術較成熟,除了成本較高,很多高端晶片已經在用。
如 HBM 儲存器成為 Chiplet 技術早期成功應用的典型代表。AMD 在 Zen2 架構晶片使用 Chiplet 思路,CPU 用的是 7 奈米製程,I/O 使用 14 奈米製程,與完全由 7 奈米打造的晶片相比成本約低 50%。英特爾也推出基於 Chiplet 技術的 Agilex FPGA 系列產品。
不過,Chiplet 技術仍面臨諸多挑戰,最重要之一是互連介面標準。互連介面重要嗎?如果是在大公司內部,比如英特爾或 AMD,有專用協議和封閉系統,在不同裸晶片間連接問題不大。但不同公司和系統互連,同時保證高頻寬、低延遲和每比特低功耗,互連介面就非常重要了。
2017 年,DARPA 推出 CHIPS 戰略計劃(通用異構整合和 IP 重用戰略),試圖打造開放連接協議。但 DARPA 的缺點是,側重國防相關計畫,晶片數量不大,與真正商用場景有差距。因此一些晶片業公司成立組織「ODSA(開放領域特定架構)工作組」,透過制定開放的互連介面,為 Chiplet 的發展掃清障礙。
另闢蹊徑
除了在現有框架內做架構和製造創新,還有研究人員試圖跳出電腦現行的范紐曼型架構,開發真正模擬人腦的計算模式。
范紐曼架構,數據計算和儲存分開進行。RAM 存取速度往往嚴重落後處理器的計算速度,造成「記憶體牆」問題。且傳統電腦需要透過總線,連續在處理器和儲存器之間更新,導致晶片大部分功耗都消耗於讀寫數據,不是算術邏輯單元,又衍生出「功耗牆」問題。人腦則沒有「記憶體牆」和「功耗牆」問題,處理訊息和儲存一體,計算和記憶可同時進行。
另一方面,推動 AI 發展的深度神經網路,雖然名稱有「神經網路」四字,但實際上跟人腦神經網路運作機制相差甚遠。1,000 億個神經元,透過 100 萬億個神經突觸連接,使人腦能以非常低功耗(約 20 瓦)同步記憶、演算、推理和計算。相比之下,目前的深度神經網路,不僅需大規模資料訓練,運行時還要消耗極大能量。
因此如何讓 AI 像人腦一樣工作,一直是學界和業界積極探索的課題。1980 年代後期,加州理工學院教授卡弗·米德(Carver Mead)提出神經形態工程學的概念。經過多年發展,業界和學界對神經形態晶片的摸索逐漸成形。
軟體方面,稱為第三代人工神經網路的「脈衝神經網路」(Spike Neural Network,SNN)應運而生。這種網路以脈衝信號為載體,更接近人腦的運作方式。硬體方面,大型機構和公司研發相應的脈衝神經網路處理器。
早在 2008 年,DARPA 就發起計畫──神經形態自適應塑膠可擴展電子系統(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,簡稱 SyNAPSE,正好是「突觸」之意),希望開發出低功耗的電子神經形態電腦。
IBM Research 成為 SyNAPSE 計畫的合作方之一。2014 年發表論文展示最新成果──TrueNorth。這個類腦計算晶片擁有 100 萬個神經元,能以每秒 30 幀的速度輸入 400×240pixel 的影片,功耗僅 63 毫瓦,比范紐曼架構電腦有質的飛躍。
英特爾 2017 年展示名為 Loihi 的神經形態晶片,包含超過 20 億個晶體管、13 萬個人工神經元和 1.3 億個突觸,比一般訓練系統所需的通用計算效率高 1 千倍。2020 年 3 月,研究人員甚至在 Loihi 做到嗅覺辨識。這成果可應用於診斷疾病、檢測武器和爆炸物及立即發現麻醉劑、煙霧和一氧化碳氣味等場景。
中國清華大學類腦計算研究中心的施路平教授團隊,開發針對人工通用智慧的「天機」晶片,同時支持脈衝神經網路和深度神經網路。2019 年 8 月 1 日,天機成為中國第一款登上《Nature》雜誌封面的晶片。
儘管已有零星研究成果,但總體來說,脈衝神經網路和處理器仍是研究領域的方向之一,沒有在業界大規模應用,主要是因為基礎演算法還沒有關鍵性突破,達不到業界標準,且成本較高。
附圖:▲ 不同製程節點的晶片設計製造成本。(Source:ICBank)
▲ 可重構計算架構與現有主流計算架構在能量效率和靈活性對比。(Source:中國科學)
▲ 異構整合成示意動畫。(Source:IC 智庫)
▲ 通用處理器的典型操作耗能。(Source:中國科學)
資料來源:https://technews.tw/2021/02/23/what-to-do-if-the-chip-cannot-keep-up-with-the-evolution-of-the-algorithm/?fbclid=IwAR0Z-nVQb96jnhAFWuGGXNyUMt2sdgmyum8VVp8eD_aDOYrn2qCr7nxxn6I
同時也有1部Youtube影片,追蹤數超過3萬的網紅StockFeel 股感知識庫,也在其Youtube影片中提到,投資台積電也了解一下台積電的技術護城河在哪裡吧!奈米製程裡用到的EUV技術,極紫外光是什麼呢?雖然三星、Intel英特爾也有EUV光刻機/曝光機,但是最終能夠駕馭這個技術並成功量產的還是 2330 台積電。 #台積電 #EUV #7奈米 #台積電新聞 #台積電股價 EUV的成果是2330台積電股...
微影製程原理 在 狄驤的資本主義求生筆記 Facebook 的最佳貼文
【台灣面板業產值僅次於半導體產業?!搞懂面板的原理和製程,你才能跟上產業趨勢...】
根據台灣顯示器產業聯合總會(TDUA)資料,2019年台灣面板出貨量高居全球第二,顯示科技產業產值達1.4兆元(新台幣),產值占我國GDP 8%,僅次於半導體產業。
由此可知,台灣除了半導體產業,顯示器產業也對台灣相當重要。
畢竟,現代人每天相處時間最久的東西,絕對不是人,而是各類光電面板,例如:手機、平板、電腦、電視的螢幕。
可想而知,在這人類已經脫離不了螢幕的時代,顯示器產業自然會有巨大商機。
因此,只要你足夠了解顯示器產業以及零組件材料廠商,你就可以隨著市場變化,找到適合的投資標的。
雖然很多投資人都認為,面板不是什麼高科技產業,不值得長期投資。
然而,就是因為近十年來,面板產業沒有進入像半導體業<摩爾定律>先進製程軌道,產業的創新和革命一直沒有爆發性。
但去年起拜疫情和電動車及5G需求之賜,當前的面板產業除了也有漲價題材,未來在產業創新上,也啟動了類似<摩爾定律>進程,朝微型化,成本降低和高效能方向升級...
此外,投資人要跟上面板業的<摩爾定律>製程利多,不能只認識面板股最有名的友達與群創,這樣反而會錯失許多優質的投資標的,還要先搞懂面板的基礎製程和材料和技術的演進,才能擬定出最佳投報率的投資計劃。
因此,這次就要來簡單和大家介紹顯示器產業和相關廠商,同樣的,因為顯示器會牽扯到許多光學和物理化學原理,此次科普我會以白話的方式讓不是本科系的人,能夠大致瞭解顯示器產業和相關廠商。
相信有點年紀的朋友們,都還記得甚至家裡還有大屁股的電視或電腦顯示器,也就是陰極射線管(CRT)顯示器,但這種顯示器已經過時,因此不列入討論,就讓我們先從近代普及率最高的,薄膜電晶體液晶顯示器(TFT-LCD)開始說起吧!
首先,TFT-LCD大多是由無數個RGB像素排列而成,用放大鏡看螢幕的某部分就可以發現(如下圖),請大家不要過於近距離觀察螢幕以免傷眼。
依顯示器大小而定,TFT-LCD可能會有數千到數百萬個「像素(Pixel)」,在螢幕上顯示文字或圖、影像,每個像素都有紅(R)、綠(G)、藍(B)三種不同顏色的「次像素(Sub-pixel)」。
例如,一台顯示器解析度是1920*1080,就代表它有2,073,600個像素,且因畫素都由紅、綠、藍三個次像素構成,因此這台顯示器共有6,220,800個次像素。
另外,以紅、綠、藍「光的三原色」就能顯示出,人類眼睛大部分能分辨出的色彩,例如,紅+綠=黃,紅+藍=紫,紅+綠+藍=白,等顏色。
接著,TFT-LCD像素背後的構造是甚麼,又是如何製作的呢?
TFT-LCD的構造,大致可以分成背光模組、玻璃基板、偏光板、液晶、薄膜電晶體、彩色濾光片和驅動IC。
另外,TFT-LCD的主要製程可分為三段,前段Array ,中段Cell和後段Module (模組組裝)。
前段的 Array 製程與半導體製程相似,不同的是並非將矽晶圓作為基板,而是將薄膜電晶體製作於玻璃上。
中段的Cell ,是將前段Array的玻璃為基板,與彩色濾光片的玻璃基板貼合,並在兩片玻璃基板間灌入液晶。
後段的Module,是將Cell製程後貼合的面板與其他如驅動 IC、背光板、等多種零組件組合。
*背光模組(Backlight Module)
由於TFT-LCD 為「非自發光顯示器」,因此,必須透過背光模組發出背光源投射光線,讓光線依序穿透TFT-LCD構造中的偏光板、玻璃基板、液晶層、彩色濾光片、玻璃基板、偏光板等零組件,最後進入人的眼睛成像,才能達到彩色顯示的功能。
值得一提的是,背光模組中的背光源,不只可用大多傳統TFT-LCD常見的冷陰極燈管(CCFL),也可用發光二極體LED,和近期最夯的次毫米發光二極體(Mini LED),另外,作為TFT-LCD 的背光源,也是Mini LED未來最廣泛的應用,Mini LED分析和相關廠商可見之前的【超深V周報】。
背光模組佔TFT-LCD成本約22%,廠商:中光電(5371)、瑞儀(6176)。
那麼,TFT-LCD其他的零組件功用分別是甚麼,又是哪些廠商製造的?
台灣面板業是否會隨著Mini LED的量產,再次迎來爆發期呢?
有興趣的朋友可點擊下方連結,繼續閱讀完整文章。
【限時公開文章】面板產業鏈也有「摩爾定律」?搞懂面板的原理和製程,你才能跟上產業趨勢...
https://www.pressplay.cc/project/vippPage/%E9%99%90%E6%99%82%E5%85%AC%E9%96%8B%E9%9D%A2%E6%9D%BF%E7%94%A2%E6%A5%AD~/F2CB7A9CBB5F4D46046A5EEBBDE6F730?limited_code=17989272F3C18578F2BE32EA2FD3AB0E
微影製程原理 在 台灣應用材料公司 Applied Materials Taiwan Facebook 的最佳貼文
讓全球應材人引以「微」傲!
應材科幻鉅作 《We Work Here》製作幕後大揭密🤩
.
比細胞還迷你的元件,如何讓我們踏入浩瀚的宇宙?
應材跨界團隊耗時 1 年半✨
共同創作出堪比科幻片的質感鉅作!
讓你漫步於奈米城市的同時,
看懂半導體製程!
.
↓ ↓ ↓
.
▍簡化艱深製程_用「比喻法」完成最大挑戰
.
縱使製作動畫難,但最難的是,讓「每一位」觀眾直覺理解艱深原理。為此,團隊靈機一動,繪製「奈米地圖」,以「城市概念」表現晶圓的奈米構造。同時,巧用大家熟悉的微生物、細胞做為「比例尺」,讓觀眾更直覺體會奈米世界多渺小🦐
.
.
.
▍為了流暢高畫質_高階演算設備通通出動!
.
為了呈現流暢高質感的動畫特效,團隊同時運行數台 PC,每台 PC使用了 6 張 NVIDIA 顯示卡,來執行動畫演算!
.
.
.
▍神隊友助攻_由熱愛科技的動畫團隊操刀執行
.
製作本次動畫的團隊,是熱愛科技的特效行家,接收到製作任務時,沒有被艱深的 SiN/SiO、plasma etch、ion implantation.....等原理打敗,反將模擬製程轉譯成令人直觀理解,極具科幻美感的畫面。製作團隊對科技的熱情及強大特效功力,是完成這部鉅作的最大動力!
.
.
.
▍影片總長 3 分半,製作時長 1 年半!
.
為了完成這部讓應材人都驕傲的記錄片,應材與協力夥伴,出動了 65 位以上的工作人員,開了不下 75 次的會議,絞盡腦汁,花了 18 個月的時間,完成這部影片。
.
.
.
#有這部神片以後更好解釋我在應材做什麼
#We_Work_Here
影片連結 ↓ ↓ ↓
https://www.appliedmaterials.com/weworkhere
微影製程原理 在 StockFeel 股感知識庫 Youtube 的最讚貼文
投資台積電也了解一下台積電的技術護城河在哪裡吧!奈米製程裡用到的EUV技術,極紫外光是什麼呢?雖然三星、Intel英特爾也有EUV光刻機/曝光機,但是最終能夠駕馭這個技術並成功量產的還是 2330 台積電。
#台積電 #EUV #7奈米 #台積電新聞 #台積電股價
EUV的成果是2330台積電股價可以攀升的原因之一。為什麼呢?因為臺積電在這個製程領先才能在7奈米、5奈米上領先對手三星、Intel,讓訂單持續湧入。臺積電在防塵技術上的突破,就算是一顆奈米級的灰塵也會因此影響半導體廠的生產良率,而EUV光刻機對於防塵的要求又比過去採用DUV光刻機時更高,因此在三星及Intel都還卡在防塵處理這關時,台 積 電 成功改良了光罩防塵技術,就因此讓TSMC成為全球首間導入EUV技術並且達成量產的廠商,在7奈米的訂單上大幅超越死敵三星。
極紫外光大家可以理解為一種波長較短的紫外光,lithography最早是石版印刷的意思,現在也被用來稱呼為光刻技術,所以把他們兩者合起來就是“利用極紫外光來進行雕刻”的意思,那要雕什麼呢?要雕晶圓。
延伸閱讀:
台積電如何在財務數據打趴中芯國際
https://www.stockfeel.com.tw/?p=97264
挑戰晶圓代工霸主(I)─台積電VS聯電
https://www.stockfeel.com.tw/?p=41088
格羅方德退出 7 奈米 台積電笑納 AMD 需求
https://www.stockfeel.com.tw/?p=70550
資料參考:
《一文看懂光刻機》
《晶圓代工爭霸戰:半導體知識(前傳) 》
《拿走英特爾的皇冠、超車三星,台積電贏在一顆奈米級灰塵 》
股感:https://www.stockfeel.com.tw/
股感Facebook:https://www.facebook.com/StockFeel.page/?fref=ts
股感IG:https://www.instagram.com/stockfeel/
股感Line:http://line.me/ti/p/@mup7228j
台積電拚5奈米關鍵技術!影片直擊極紫外光EUV微影技術是怎麼運作的https://www.bnext.com.tw/article/57392/asml-euv-tsmc-how-to-operation
何謂 EUV 微影?https://www.gigaphoton.com/ct/technology/euv-topics/what-is-euv-lithopgraphy
微影製程原理 在 【他們其實有點像!ASML微影設備VS單眼反光相機 】... 的美食出口停車場
我們可以把微影設備想像成一台巨大的單眼反光相機: 相機的原理:被拍攝物體被光線照射所 ... 機台採用錫的電漿,將微影製程中的光源波長縮短為 ... <看更多>
微影製程原理 在 四種對準和曝光系統 :: 博碩士論文下載網 的美食出口停車場
博碩士論文下載網,正光阻負光阻優缺點,曝光解析度,接觸式曝光,何謂黃光製程,步進式曝光機,Proximity 曝光機,微影技術,微影製程缺陷. ... <看更多>