為什麼“28nm光刻機”多重曝光也做不到7nm?
今天討論的主題是:28nm光刻機為什麼不能通過多曝工藝實現14nm,甚至7nm的曝光工藝?在了解這個複雜的半導體知識之前,還得先學習前置的知識點。今天知識點內容包括:第一、所謂28nm光刻機是什麼?如何定義?第二,決定光刻機的最小精度有哪些因素?什麼叫套刻精度?第三、晶體管的實際參數和定義;第四,多曝工藝/SAQP四曝工藝的詳細圖解。
字數原因分兩段,今天講第一和第二點,第三第四下一次。
全文5100多字。
一、28nm光刻機是如何定義的
首先業內並沒有28光刻機這樣的叫法,這個說法只存在民間,但是既然是科普,那還得按普通人的視角來解釋。
所以所謂的28光刻機,應該到底怎麼來定義?
按一般意義上的理解,最小精度能滿足28nm線寬的顯然就能算28nm光刻機。
那麼問題又來了,28nm的實際線寬是多少呢?
芯片的內部結構其實類似高樓大廈,最底下的晶體管間距最小,上面的金屬互聯層間距相對較大,所謂的28nm光刻機應該是指滿足M0/M1最底層的小晶體管特徵尺寸的光刻機。
28nm的實際特徵尺寸是多大呢?
28nm有兩版經典的工藝分別是28HKMG(高K金屬柵極)和28Poly(多晶矽氮氧柵極),實際上不僅僅是這2個版本,台積電當年在28nm平台上有延伸出LP,HPM, HPC,HPC+等多個版本,主要是為了針對不同的客戶需求,有些客戶追求頻率和性能,有些客戶則追求更低功耗比,因此儘管都是28nm工藝,但是在各個工藝版本略微有區別。
之所以要搞這麼多工藝版本,主要原因是這些工藝的變化,會帶來設計規則的變化。
更加靈活的設計規則一方面是能減少並改善光刻步驟,第二是不同的工藝能夠明顯改進柵極間距,目的是改善性能或者漏電。
根據業內大佬的介紹,28HPC/HPC+和28LP/HP/HPL/HPM略有區別,柵極長度分別是HPC版本的40nm/35nm/30nm和LP版本的38nm/35nm/31nm。
從這點上大家就發現了,28nm工藝的實際柵極長度,並不是28nm,最大的有40nm,而最小的則是31nm,實際上一共有6種規格,甚至22nm都能算28nm的一個變種。
從40-28nm工藝開始,工藝節點的標稱和實際柵極長度已經不是一一對應,而是相對等效關係的原因。
因此要滿足28nm工藝,在不考慮其他工藝因素的情況下,光刻機的極限分辨率應該至少能滿足40nm最小曝光線寬,但由於40nm的不是主力量產製程,實際情況應該至少滿足CD= 35nm左右的才是主力製程光刻機,也就是普通人通常意義上理解的28nm光刻機。
我查閱了ASML光刻機的各個型號的參數,從理論上講,NXT 1950的精度就可以試試看,諮詢了河哥之後也確實得到了肯定的答案,國外FAB研發工程師們最早就是嘗試使用1950進行28nm的工藝研發。
但是由於1950問題比較多,很快就被放棄,而且隨著工藝演進,國外FAB的28量產主力光刻機變成NXT 1960B和NXT 1970C。
其中1970C最好用,但是國內情況不一樣,國內當時28nm進度落後國外先進水平大約4-5年,等真的要上量的時候,1970已經沒了,所以國內的28nm量產版本其實用的是NXT 1980D,這裡僅做實際情況的說明。
實際上1980去做28nm工藝相當於大砲打蚊子,因為1980比1970貴好多,但是沒辦法,沒有舊的大砲,只能上新的大砲。
因此結合實際情況,到這裡我們可以做出一個結論:所謂的28nm光刻機實際應該特指NXT 1970Ci這個型號。
最後插入兩個小故事,第一、是某位大佬說HKMG工藝是Intel把全世界帶到坑里,走了很多歪路,原因據說這個HK是鋁。
第二,從上面的細節各位也可以看到,哪怕同一個公司,同一個工藝平台,不同版本的工藝,設計規則也是不同的。
也就是說,如果今天有個芯片設計公司想要換掉原來的流片工藝,這等於後端設計和仿真工作幾乎全部推倒重來,成本是非常高昂的,越是高端的換工藝成本就越高。
IC設計的大公司有錢無所謂,小公司真的要好好思考一下,要不要換廠,要不要換工藝這個問題,不是說話就換的。
所以不要覺得設計公司換個FAB廠流片是件很簡單的事,這不是你下樓買菜,這家不好就換一家,這裡面可複雜了,半導體領域就從來沒有簡單的事,不要用日常思維去理解半導體裡面的事,實際上根本不是一個概念。
以後有空敲一篇吐槽一下網上哪個項XX啥都不懂的專家,天天喊台積電南京廠擴產會搶光國內FAB生意,臥槽,你以為換一家FAB流片是說換就換的?生意說搶就搶?
第二,決定光刻機的最小精度有哪些因素?什麼叫套刻精度?
光刻機是一個非常龐大的光學系統,任何內部或者外部微小的差錯都會影響最終效果,光的世界裡,錯了就是錯了,有誤差就是有誤差。
如果從瑞利判據公式上看:CD=K1*λ/NA。顯然影響最小CD的因素太多,如果拋開外部影響因素這個K1,K1代表了光刻膠的聚合度,分子量,顆粒度,感光劑,以及矽片的平整度,光的入射角度,雜質/灰塵的影響量這些因素。
那麼如果是同平台,同光源波長放一起做比較,那麼影響精度最主要的原因,則是在線量測精度和雙工件台運動精度。
雙工件台,也就是ASML的獨門絕技“TWINSCAN”平台技術,讓ASML保持競爭力的最大秘訣!
插入一個ASML和尼康的小故事,我曾經叫它尼康棺材板上的三顆釘子,這是第二顆。
在《光刻巨人》那本書上也提到過,儘管當年在8英寸工藝上,ASML的PAS 5500也通過了IBM/Intel們的認證,但是實際採購上Intel基本沒怎麼正眼看過ASML,產線上實際大量採購的還是尼康的S-204/205。
大量採購PAS 5500光刻機,反而是台積電、三星、美光這樣的代工和存儲客戶。
實際上在設備產能這項指標上,PAS 5500是強於S205的,為什麼Intel們就不用呢?
原因很簡單,因為對於壟斷CPU市場的Intel而言,市場蛋糕足夠大,完全可以躺賺,生產快一點還是慢一點根本無關痛癢,因此從未要求高產能。一度Intel的產能利用率只有60%,甚至晚上都不開工,慢慢悠悠絲毫不慌,因此這也是哪怕PAS 5500對比尼康的S205有產能優勢,但是在前期Intel也對ASML沒有興趣的原因。
但是台積電們不一樣,產能就是生命線,60%的產能利用率?晚上就停工不生產?這還不虧炸啊?
對於台積電這類晶圓代工企業而言,必須在成本、效率、產能上有優勢,才能殺出這個激烈的戰場,才能在競爭中站穩腳跟。
所以競爭使人進步,壟斷使人慵懶,ASML使用高產能的光刻機來牢牢抓住台積電們的心,同理存儲廠也是,競爭非常激烈,哪像Intel那樣能躺著賺錢啊!
不過話說回來,FAB廠的工作,殘酷是真的殘酷,也只有東亞文化圈培養出來的隱忍,絕對服從工程師才能適應。
以前台積電流傳個段子:你在台積電工作會很有錢,因為你根本沒有花錢的時間。
殘酷度可見一斑,什麼996在FAB面前都弱爆了!
FAB的活和製度簡直不是人幹的!最近網上有個特許出來的哥們,在長篇連載當年他在新加坡特許的工作經理故事叫《一名芯片老兵的回顧》,各位可以去看一下,非常現實。
也許看完以後,你就知道,洒家為什麼敢放出豪言“如果台積電的亞利桑州新廠做的好,我就去科羅拉多河裡倒立洗頭的誓言”。
因為我覺得美國這幫人,就不可能把這項工作做好。要不去灣灣那邊搞人過來,但是各位都懂,想去美國的都是為了拿綠卡的潤人,心懷鬼胎的那種,能做的好是真的有鬼了。
回到主題上,那ASML是如何提高產能呢?它拿出了什麼樣的絕活?
回顧起來,解決方案其實很簡單。
圖案在被曝光到晶圓前,必須對晶圓進行精準量測。量測和曝光都需要時間,為了減少每個過程需要的時間提升效率,為什麼不在曝光一個晶圓的同時,對後一個晶圓開始進行量測和對準工作呢?
就這樣,TWINSCAN系統誕生了
TWINSCAN系統:一個負責前期對準量測,另外一個負責曝光
TWINSCAN是第一個也是唯一一個具有雙晶圓工作平台的光刻系統。
晶圓被交替地裝載到TWINSCAN平台上,當一個平台上的晶圓正在曝光時,另一個晶圓被裝到二號平台進行對準和測量,然後兩個平台交換位置,原來在二號平台的晶圓進行曝光,而一號平台的晶圓完成卸載。然後,新的晶圓被裝載,進行對準和測量工作。
這種量測對準和曝光同時進行的並行方案能極大提高光刻機單位小時內的產能,這幫助台積電們極大提高生產效率,提升最終效益。
2001年,首個採用這種革命性技術的TWINSCAN雙晶圓平台系統出貨了——TWINSCAN AT:750T型光刻機。
750T型光刻機使用的是波長為248nm的KrF光源系統,支持130nm工藝的生產。
不久,ASML的i線光刻機也引入了雙晶圓平台,即TWINSCAN AT:400T;隨後這項技術又引入到更高端的193nm的ArF光刻機上,即TWINSCAN AT:1100。因此從i線到KrF線,TWINSCAN系統跨越ASML各個平台型號的光刻機,擴大了技術範圍,讓所有芯片層都能在新平台上曝光。
ASML的持續創新能力為TWINSCAN平台的分辨率、套刻精度和產率提供了漸進式的改進——以平台升級、新系統升級和現場升級等不同方式,總之客戶怎麼舒服怎麼來。
因此,雙工件台的運動精度在某種程度上,是光刻機對準精度的關鍵中的關鍵!
了解雙工件台的工作過程也讓人感覺到不可思議,這就是科技的力量。
它們每時每刻都在高速運動,靜止的狀態瞬間急加速然後瞬間急停下達到的它應該停的位置上,精確度令人嘆為觀止。
如果按照瞬間的加速度算,已經超過火箭發射升空的速度,下一刻精準的停在位置上,不能出現任何差錯,因為這種速度下任何差錯都沒辦法彌補。
錯了雖然不至於整片晶圓報廢只能重來,但是這樣差錯多幾次,趕緊跑路吧,工程師直接提著40米大刀來砍人了。
雙工件台就這樣加速-急停-加速-急停,不斷重複這一過程,同時保持長期穩定工作的狀態。
因此雙工件台這套系統某種意義上講,決定了光刻機最大產能,以及它的精度,在光刻機的世界裡這個叫Overlay——套刻精度。
以NXT 1980Di為例,官方給的參數是OPO≤3.5nm,DCO≤1.6nm,MMO≤2.5nm。通常更差4-5
重點來了!科普一個99%都不知道的知識。
OPO是On Product Overlay的意思,產品上的套刻精度,因為芯片製造工藝有點類似蓋樓的過程,相當於上次曝光和現在的對齊精度,這個精度是3nm以內。
DCO是Dedicate Chuck Overlay的縮寫,相當於同一台設備自己套自己的精度,這個是1.6nm以內。
MMO是Mix-and-Match Overlay的縮寫,相當於不同設備之間的套刻精度,這個可以做到小於2.5nm。
還記得多曝工藝嗎?多曝工藝其中有很重要的一步,就是把原本一塊掩膜板圖形,拆分兩塊分兩次曝光,以此來得到更小的圖形。
顯然,不管是OPO還是DCO,還是MMO,這幾個參數共同決定了你能不能用多曝工藝,以及量產之後的曝光圖形的一致性,和上下層最終的對準精度。
如果不管是哪個參數不夠看,那麼多次曝光做出來的圖形,一定是歪歪扭扭,慘不忍睹,一塌糊塗,別說良率了,估計整個晶圓都得報廢。
今天網上有傳這個圖:
圖片來自群友提供,如有侵權說一聲
只能說上面錯誤百出,什麼NXE 3400 寫成NXT, 什麼NXT 2000早停產了,也根本沒有賣進過國內,什麼2050能做到5nm,不說了錯太多了。
我這裡直接上關老師的整理數據:
大家來找茬,看看有多少地方是錯的。
回到主題。
之所以,為什麼1970只能幹到28nm,14nm都很吃力,7nm就更別提了,原因就在這裡,1970的Overlay和1980相比,差一截啊!
Overlay的性能不夠看,臣妾做不到啊!
所以雙工件台,從某種程度上來講,是除了光源、物鏡系統之外,最重要的關鍵部件。
它的穩定性,對準精度,平均無故障運行時間直接影響著光刻機的實際工作狀態,甚至影響整個FAB的工藝水平和產能。
因此一片晶圓上需要曝光多達數百個單元(Field),而先進的光刻機一個小時能曝光超過300片矽晶圓,同時保證每一次曝光量都是相同的。
假設一片12英寸晶圓上有300個單元面積需要曝光,那麼相當於一天曝光2160000次,一年788400000次,雙工件台以及整個設備的穩定性和效果一致性是個巨大的考驗。
也許這些數字並不能讓你覺得什麼,但是細想之後這些數字的所代表技術含量確實令人震撼。
以前有人曾形像比喻,相當於兩架高速飛行的飛機,其中一人拿出刀在另外一架飛機米粒大小的面積上刻字。
這種精密動作到令人髮指的機器想要保持7*24小時穩定工作,是工程學上最困難的挑戰,有無數技術高峰需要跨越。
之前國內號稱某某實驗室能做到幾納米,一大堆人吹捧超越ASML指日可待,要知道實驗室設備刻兩條直線到商用設備全天候穩定運行曝光復雜圖形之間可謂是天塹之別。
我知道國內在某些環節的關鍵技術上有所突破,但是任重而道遠,離真正成功還有很長的路要走。