歡迎來到114ic電子網!登錄免費注冊 加為收藏

打破“内存墻”的新思考

時間:2022-1-25 10:50:00
摘要: 新一代的高效能系統正面臨資料傳輸的頻寬限制,也就是記憶體撞墻的問題,運用電子設計自動化與3D制程技術,IMEC證實3D SoC設計能大幅提升性能并降低功耗,成為備受矚目的異質整合解決方案。
新一代的高效能系統正面臨資料傳輸的頻寬限制,也就是記憶體撞墻的問題,運用電子設計自動化與3D制程技術,IMEC證實3D SoC設計能大幅提升性能并降低功耗,成為備受矚目的異質整合解決方案。
展望高效能應用加速開發3D SoC設計


資料密集的高效能系統用于先進運算、伺服器或深度學習應用,然而,現在卻面臨着所謂的「記憶體撞墻(memory wall)」問題,而且這項挑戰日益嚴峻,資料存取速度難以突破瓶頸。為了推倒這面高墻,3D系統單芯片(SoC)整合技術備受矚目。利用這套異質整合方法,芯片系統能自動分割為多個獨立芯片,并實現這些芯片的3D同步設計與互連(interconnect)。
在2021年IEEE國際電子元件會議(IEDM)上,IMEC的研究團隊發表了兩篇3D SoC與晶背互連技術的論文,其中一篇列舉了3D SoC這項設計概念的技術優勢,目标要實現多芯片的異質系統整合,超越時下炙手可熱的小芯片(chiplet)設計。
IMEC資深研究員,同時也是3D系統整合研究計劃的研發副主任Eric Beyne表示:「小芯片概念涉及了多個小芯片的獨立設計與制造,著名的例子就是高頻寬記憶體(HBM),它把多個DRAM芯片堆疊起來,接着透過介面匯流排,把堆疊連接到處理器芯片,因此在應用上必須容忍一定的延遲時間。有鑒于此,小芯片設計永遠無法在邏輯單元與一級和二級快取記憶體之間實現快速存取。」
3D SoC整合技術采用直接連接且距離更短的互連導線來進行記憶體與邏輯單元的分割,最終能顯著改善傳輸性能。在論文中,IMEC團隊展示了一項經過優化的3D SoC設計,将記憶體巨集(memory macro)置于最上層芯片,其余邏輯單元則在底層,其運作頻率與2D設計相比,提高了40%。

圖一: IMEC于2021 IEDM展示的未來高效能系統抽象視圖:高效能芯片與3D SoC記憶體堆疊布建于主動式中介層上方,并将中介層作為閘道,以2.5D的方式連接到局部HBM和光學收發器模組。


為了實現全功能化的3D SoC,關鍵的技術挑戰也納入了讨論。IMEC主任研究員,也是布魯塞爾自由大學教授的Dragomir Milojevic指出:「從設計面來看,在進行邏輯單元和記憶體的分割時,都要采取3D SoC協同設計的策略。這就會用到專屬的電子設計自動化(EDA)工具,才能同時顧及兩方的設計,并在布局與布線時,利用自動化工具完成系統分割與3D關鍵路徑優化。透過與益華電腦(Cadence)合作,我們已經取得這些先進工具。」
他接着分享,在技術層面,晶圓對晶圓的異質接合解決方案将會持續發展,進一步提升芯片之間的互連導線密度,這對一級和二級快取分割來說是必要技術。

圖二: IMEC于2021 IEDM展示間距為700nm的晶圓對晶圓異質接合技術。


下一步計劃:開發晶背


高效能3D SoC的系統分割可能會将部分或全部的記憶體巨集布建在最上層芯片,邏輯單元則置于最下層。在技術上要做到這點,可以将放置邏輯單元的晶圓主動側正面,以低溫晶圓對晶圓的接合技術,鏈結到記憶體所在的晶圓主動側正面。在這種配置下,原本的兩面晶背會變成3D SoC系統的外側。
Eric Beyne點明:「現在我們可以考慮利用這些『空出來的』晶背,用于訊号繞線,或是直接供電給邏輯單元晶圓上的電晶體。傳統制程通常把繞線和電源供應設計在晶圓正面,所以在處理復雜互連導線的後段制程中,必須努力争取空間,而晶背在這類設計中僅僅作為封裝用的芯片載體。」
他進一步說明,2019年Arm的模拟結果首次證明在CPU設計中導入晶背電源供應網路(power delivery network;PDN)所帶來的正面效益。該CPU設計采用IMEC開發的3nm制程,位于薄型化晶背的互連導線連接到晶圓正面的3nm電晶體,兩者透過落在埋入式電源軌(buried power rail;BPR)結構上的矽穿孔(through silicon via;TSV)相連。根據模拟結果,晶背PDN的傳輸效率比傳統的正面PDN還高出7倍。
因此,可以預期在記憶體與邏輯單元堆疊(memory-on-logic)的3D SoC應用上,運用晶背PDN來供電給位于底層且功耗較大的核心邏輯電路,将能額外加強性能。甚至還能設計替代的3D SoC系統分割方案,把像是一級快取SRAM等的部分記憶體芯片置于底部,從晶背實現電源供應。
晶背PDN除了擴展3D SoC設計的潛能,還曾被提議可用于積層型單芯片邏輯與SRAM的SoC應用,協助達成元件與芯片的進一步微縮。IMEC3D系統整合研究計劃負責人Geert Van der Plas說道:「研究結果顯示,将電源供應網路轉移到晶圓背面是個有趣的解決方案,不僅能用來面對後段制程的布線壅塞挑戰,還能減低壓降。」
「3D SoC方案的主要差別是将一片虛拟晶圓接合到目标晶圓,以利進行晶背研磨和金屬化。」他進一步解釋。IMEC的合作夥伴近期就宣布在其中一款先進制程芯片中采用這種晶背PDN設計。
晶背互連技術讓性能再升級


晶背PDN的技術優勢已在特定設計中獲得驗證,而善用晶背的其它效益還可望在全域訊号繞線的應用上浮現。IMEC已聯手益華電腦,針對在晶背進行部分繞線的SRAM巨集與邏輯電路設計,首次進行評估與優化。SRAM巨集不僅與記憶體單元陣列有關,還包含位址解碼器、控制單元等與處理器設計相關的周邊電路。

圖三: IMEC于2021 IEDM展示傳統制程的晶圓正面後段制程、背面PDN和訊号布線。其中,晶背利用納米矽穿孔(nano-TSV;nTSV)将導線向外連接,包含連至BPR的PDN布線,以及連至晶圓正面導線的訊号布線。


SRAM巨集和邏輯單元的訊号繞線最多需要3層晶背金屬層,而納米矽穿孔負責将晶背導線連接至晶圓正面。SRAM巨集的設計導入了2nm納米片電晶體,而且只有用于周邊電路的全域繞線會與晶背導線相連。邏輯單元則運用環形振蕩結構來評估利用晶背進行訊号繞線所帶來的影響,邏輯标準單元也采用2nm制程的叉型片。實體布局方面,IMEC選用了同樣以2nm叉型片制程設計套件(PDK)制成的64位元Arm CPU,以确保環形振蕩器的模拟結果能夠發揮作用。
Geert Van der Plas解釋:「根據研究,與正面布線相較,晶背布線在改善長距離訊号繞線的延遲和功耗上,出乎意料地表現突出。我們成功展示了SRAM巨集的性能最高能提升44%,功耗最多降低30%,邏輯單元的傳輸則能加速至2.5倍,功耗效率增加60%。」

圖四: SRAM巨集在不同列行設計下的全域布線讀取延遲時間:(a)晶圓正面(b)背面(c)從正面至背面的延遲差距。巨集大小涵蓋128*128*16=256kbit~512*512*16=4Mbit。


為了評估這些電路的性能與功耗,IMEC進行了多項實驗并建立模型。Dragomir Milojevic指出:「實驗涉及了納米矽穿孔制程在電容與電阻方面的優化,以确保晶圓正面與背面的導線之間能夠維持良好的電氣連接。這些參數也被饋入模型以進行模拟。最後我們采用設計—技術偕同最佳化(design-technology co-optimization)策略驅動的布線優化技術,可望在未來持續精進。」成果顯示,透過降低晶背導線的電容,性能可再提升20%。

『本文轉載自網絡,版權歸原作者所有,如有侵權請聯系删除』