1. 芯片設備三巨頭最新觀點
在此前美國的一場討論會上,面對高盛分析師Jim Schneider關于2025年晶圓廠設備市場前景的提問,Applied Materials CEO Gary Dickerson給出“低單位數成長”的保守預測,KLA Corporation CFO Bren Higgins卻預期“中單位數增長”,Lam Research CFO Doug Bettinger則完全回避數字預測。這種分歧并非市場判斷能力的差異,而是三家巨頭對半導體技術發(fā)展方向有著根本性的不同看法。
半導體設備產業(yè)向來以技術門檻極高著稱,Applied Materials的材料工程、KLA的檢測系統、Lam Research的蝕刻工藝,每項技術都需要十年以上的深度積累。然而,AI制程需求的爆發(fā)與地緣政治限制正在壓縮產業(yè)的技術更新周期,迫使設備商在不確定性中做出戰(zhàn)略押注。從2022年管制啟動到當前市場格局重塑,整個產業(yè)正在經歷從技術分歧到競爭邏輯重構的深層變革。三大設備巨頭將透過技術路線差異、產業(yè)生態(tài)斷裂、制造方式革命,以及政治風險內化四個維度,展現這場產業(yè)轉折點的真實面貌。
Gary Dickerson的謹慎表態(tài)背后,隱藏著Applied Materials對未來技術路線的深度思考。這位執(zhí)行長在會議上強調iCAPS市場的“消化期”,實際上反映了該公司對摩爾定律平面縮放到達極限的判斷。 Applied Materials正在押注先進封裝技術,認為AI芯片的復雜性將迫使產業(yè)從2D轉向3D整合。該公司位于奧巴尼的EPIC Center已投入15億美元,專門開發(fā)CoWoS(Chip-on-Wafer-on-Substrate)技術,這是一場對異質整合未來的豪賭。 Dickerson相信,當CPU、GPU、記憶體必須整合在同一封裝內時,傳統的晶圓制造將讓位給材料工程和封裝技術。
Bren Higgins的樂觀預測則建立在制程復雜化不可逆轉的技術判斷上。 KLA Corporation這位財務長在會議中詳細描述了一個技術現實:臺積電3納米制程的檢測步驟比7納米制程增加60%,每當制程節(jié)點向前推進,電晶體尺寸就更接近物理極限。 Higgins押注的是“制程越先進,檢測越重要”的技術邏輯,該公司的電子束檢測設備能夠發(fā)現10納米以下的缺陷,正好契合AI芯片的零容錯要求。 KLA相信,即使地緣政治風險持續(xù),先進制程的檢測需求也不會減少,反而會因為良率壓力而持續(xù)增長。
Doug Bettinger的策略回避顯露出Lam Research對技術路線的復雜判斷。該公司財務長在會議中反覆提及“etch-and-deposition intensity”概念,暗示公司同時押注兩個技術方向:3D NAND的垂直擴展和先進邏輯的3D架構。 3D NAND從96層向200層演進需要深寬比超過100:1的垂直蝕刻技術,而AI芯片的3D電晶體結構同樣需要原子級精度的工藝控制。然而,這兩個技術方向都面臨物理極限的挑戰(zhàn),Lam Research選擇保留戰(zhàn)略彈性,等待市場需求進一步明朗化。
Applied Materials中國營收從32%暴跌至18%,每季損失10億美元的數字震撼市場,但真正的危機遠超財務報表。這家設備巨頭失去的不僅是收入來源,更是與全球最大半導體消費市場的技術共同發(fā)展機會。中國市場向來是新技術驗證和工藝優(yōu)化的重要場域,當Applied Materials被迫退出時,該公司實際上失去了一個關鍵的技術改進回饋機制。更嚴峻的是,中國本土設備商北方華創(chuàng)、中微公司正在成熟制程領域快速追趕,Applied Materials重返中國市場的技術門檻正在不斷提高。
KLA Corporation面臨的5億美元損失看似溫和,但技術生態(tài)的影響更加深遠。該公司的檢測設備不只是硬體產品,更是整個制程監(jiān)控體系的技術核心。中國晶圓廠被迫尋找替代方案時,正在重新建構獨立的檢測標準和供應鏈體系。長期而言,這種技術標準的分化將導致全球半導體產業(yè)出現兩套平行的品質管控系統,所有參與者的研發(fā)成本和技術復雜度都將大幅增加。 KLA面臨的真正挑戰(zhàn)不是短期收入損失,而是全球技術標準統一性的瓦解。
Lam Research中國營收占比從32%縮減至24%的過程中,客戶支援業(yè)務群組(CSBG)受到最嚴重沖擊。半導體設備的商業(yè)模式特性決定了設備銷售只是開始,后續(xù)十年的技術支援、升級改造、備件供應才是真正的利潤來源。一臺蝕刻設備的使用周期通常超過十年,服務收入往往是設備價值的兩倍以上。中國市場的服務中斷不僅是當期現金流損失,更意味著未來十年收益的永久消失。這種產業(yè)生態(tài)鏈的斷裂正在重塑全球半導體設備產業(yè)的商業(yè)邏輯。
Applied Materials賭的是封裝技術將取代傳統制程,KLA賭的是檢測需求將無限放大,Lam Research賭的是保持選擇權比下注更安全。三家公司看似預測市場,實際上是在選擇生存方式:是押注單一技術路線獲得先發(fā)優(yōu)勢,還是分散風險等待局勢明朗?
時間會證明誰的判斷更準確。 AI芯片的制造需求能否真正彌補中國市場的損失,先進封裝技術能否如Applied Materials所愿成為新的增長引擎,檢測設備的重要性是否如KLA預期般持續(xù)提升,市場終將給出答案。
但無論結果如何,有一點已經確定:半導體設備產業(yè)已經從純粹的技術競爭,轉變?yōu)榧夹g與政治并重的復合競爭。在這個新的競爭環(huán)境中,技術領先不再是唯一的勝負標準,政治風險管控能力同樣決定企業(yè)的生死存亡。游戲規(guī)則已經改變,回不去了。
2. openai與英偉達合作開發(fā)10千兆瓦系統
OpenAI 與英偉達確實已宣布達成戰(zhàn)略合作伙伴關系,計劃共同開發(fā)并部署至少 10 千兆瓦(10 gigawatts)的人工智能基礎設施系統,用于訓練和運行 OpenAI 的下一代模型,推動通往“超級智能”的目標。
合作要點如下:
部署規(guī)模:雙方將建設并部署至少 10GW 的 NVIDIA 系統,代表數百萬顆 GPU 的算力,是目前全球最大規(guī)模的 AI 數據中心建設計劃之一。
投資金額:英偉達計劃隨著每千兆瓦系統的部署,逐步向 OpenAI 投資高達 1000 億美元,用于支持數據中心和電力基礎設施建設。
時間表:首個 1GW 的系統預計將在 2026 年下半年上線,采用英偉達下一代 Vera Rubin 平臺。
合作性質:OpenAI 將英偉達列為其“AI 工廠增長計劃”的首選戰(zhàn)略計算與網絡合作伙伴,雙方將協同優(yōu)化硬件與軟件發(fā)展路線圖。
此次合作標志著 AI 基礎設施建設進入“吉瓦級”時代,遠超傳統數據中心的規(guī)模。
3. 傳中芯國際在測試首款國產28納米DUV光刻機
據多家行業(yè)媒體援引知情人士近日消息,中芯國際(SMIC)已開始對首款國產深紫外(DUV)光刻機進行評估和測試。
據悉,中芯國際正在測試的深紫外線(DUV)光刻機由上海初創(chuàng)公司宇量昇生產,采用浸沒式技術,類似于ASML所采用的技術。這臺國產的28納米(nm)DUV光刻機,可利用“多重曝光技術”生產7納米芯片,即在沒有EUV光刻機的情況下,通過多次光刻實現更精細線路圖案的折中方案。
目前尚不清楚該光刻機是否及何時能夠用于高端芯片的量產。但毫無疑問,成功研發(fā)并量產國產DUV光刻機,對于保障中國龐大的成熟制程芯片供應鏈安全、提升產業(yè)鏈韌性具有至關重要的戰(zhàn)略意義。
4. CPO概念爆火2025年光通信革命哪些企業(yè)已入局?
共封裝光學(Co-packaged Optics, CPO)作為光通信領域的顛覆性技術,在2025年迎來了爆發(fā)式增長。
2025年3月,英偉達在GTC大會上正式發(fā)布了Quantum-X Photonics InfiniBand和Spectrum-x Photonics Ethernet兩款CPO交換機,前者預計于2025年下半年上市,后者則將在2026年推出。與傳統插拔式光模塊相比,英偉達的CPO創(chuàng)新技術可將現有能效提高3.5倍,網絡可靠性提高10倍,部署時間縮短1.3倍。
盡管CPO不是非常新的技術,但其“突然爆火”并非偶然,而是技術演進、市場需求和商業(yè)壓力三者共同作用下的必然結果。最直接的原因是,它完美地解決了當前數據中心和AI計算領域最迫切的痛點——顯著縮短了電信號傳輸距離,減少了信號完整性問題,同時顯著降低了功耗和延遲。
當然,除了英偉達之外,全球還有數十家核心科技企業(yè)深度布局CPO領域,包括光通信巨頭、芯片制造商和云計算公司。市場應用方面,預計CPO技術將在2025年開始商用,2026-2027年規(guī)模上量。第一代CPO產品將從800G和1.6T端口開始商用 ,逐步向更高速率發(fā)展。本文將從技術優(yōu)勢、市場驅動力、核心企業(yè)布局、市場前景與挑戰(zhàn)等層面,全方位解析CPO技術這一2025開年以來的資本市場熱點。
CPO技術主要應用于數據中心的交換機接口,其核心優(yōu)勢體現在三個維度:功耗、帶寬密度和延遲。根據多項研究數據,CPO在關鍵性能指標上顯著優(yōu)于傳統可插拔光模塊:
功耗方面:Broadcom數據顯示,可插拔光模塊功耗范圍為15-20 pJ/bit,而CPO系統可降低50%以上,達到5-10 pJ/bit。在800G傳輸速率下,CPO功耗為5.5W,而傳統可插拔技術為14W。
帶寬密度:CPO提升5-10倍帶寬密度,支持高速光通信和高帶寬需求。
尺寸與集成度:CPO實現更小尺寸、更緊湊設計和高集成度。
延遲方面:通過消除長距離電氣連接,CPO可提供亞微秒級的低延遲。
以上關鍵性能優(yōu)勢,對于高性能計算和AI訓練集群至關重要。不過,CPO要求極高的對準精度,通常需要<50nm橫向對準公差以及光纖陣列的3D對準。
整體來看,CPO技術爆火主要有以下幾個原因:
一是最根本的驅動力:AI大模型的算力競賽。這也是CPO熱度飆升的最直接、最強大的催化劑。從2022年以來,ChatGPT等生成式AI的爆發(fā),催生了巨大的算力需求,其背后是無數英偉達GPU組成的超大規(guī)模計算集群。這些GPU之間需要高速、低延遲、高帶寬地交換數據(比如模型參數、梯度信息)。傳統的網絡連接速度無法滿足需求,導致強大的GPU算力在“等待”數據,效率低下。這也意味著GPU間通信成為瓶頸。
而CPO技術能夠將光引擎直接封裝在GPU旁邊,實現超短距離的高速互連,提供前所未有的帶寬(如1.6Tb/s甚至更高)和極低的功耗,徹底打破了GPU間的通信瓶頸,讓算力集群的性能得以充分發(fā)揮。
二是無法忍受的“功耗墻”。除了高速互聯之外,功耗是數據中心運營商的噩夢,而傳統可插拔光模塊的功耗已經逼近極限。隨著數據傳輸速率從800G向1.6T甚至3.2T演進,使用傳統的可插拔光學(Pluggable Optics)方案,光模塊的功耗、發(fā)熱和密度問題變得極其突出。一個1.6T的可插拔光模塊功耗可能超過20W,一個高密度交換機可能就需要數十個這樣的模塊,其總功耗和散熱需求是天文數字。
CPO將光引擎和電芯片(ASIC)緊密集成,通過芯片級的互連替代了傳統PCB板上的高速銅線,大幅降低了信號傳輸的功耗和損耗。數據顯示,CPO技術相比可插拔方案,能效可提升50%以上。這對于降低數據中心PUE(能源使用效率)、節(jié)省電費至關重要。
三是帶寬密度需求的爆炸式增長。數據流量每年都在指數級增長,要求交換機的端口速率和密度越來越高。然而,交換機的前面板面積是固定的,但需要塞進更多、更高速的端口。可插拔光模塊的尺寸和散熱限制了端口密度的進一步提升。CPO則將光連接移至交換機內部,與交換芯片共同封裝,解放了前面板的空間,從而極大地提高了交換機的帶寬密度。這使得單臺交換機能夠處理的數據流量呈數量級增長。
四是技術成熟度的拐點。任何技術從概念到爆火都需要經過漫長的研發(fā)和積累,而CPO正處在產業(yè)化的臨界點。CPO并非全新概念,業(yè)界已對其研究和探索了多年,在材料、硅光技術、封裝工藝、熱管理等方面都有了長足的進步,其在2023-2025年間實現了從技術概念到產業(yè)熱點的跨越式發(fā)展。
5. TechInsights 2025報告DRAM 與 NAND 趨勢與展望
DRAM
DRAM陣營里,Samsung、SK hynix、Micron三巨頭正把1z nm推向1β→1γ→1dnm,并在2027年前后轉入4F2單元結構,通過縮小特征尺寸、多層金屬互連和高介電常數電容薄膜把單片容量繼續(xù)往上頂。

3D NAND Layer
另一邊,3D NAND的層數已把218L/236L拋在身后,Samsung 286L、KIOXIA 286L、Micron 276L、SK hynix 321L、YMTC 267L紛紛進入量產。


Hybrid bonding
為了在繼續(xù)加層的同時不讓晶圓翹曲、縫隙填充和柵極應力失控,各家都把“陣列-邏輯分離+Hybrid Bonding”當成續(xù)命良藥——先在一枚晶圓上做完三百多層垂直通道與柵極堆疊,再把它倒扣到另一枚已布好外圍電路的CMOS晶圓上,用亞微米級銅-銅直接鍵合省去凸塊、壓縮厚度、提升帶寬,也讓國產YMTC Xtacking和KIOXIA BiCS-CBA在制裁陰影下仍能繼續(xù)迭代。
簡言之,存儲芯片的物理極限正被 “更細的線條、更薄的Die、更高堆疊+晶圓級混合鍵合” 這套組合一點點推開,DRAM在納米尺度里榨電容,NAND在微米垂直里深挖,Hybrid Bonding是兩者共同且最關鍵的跳板。
6. 一文讀懂大模型常見的10個核心概念
1)、大模型型號
每個大模型都有其獨特的設計和功能,有些大模型可能在語言理解方面表現出色,有些則可能在生成圖像或解決特定領域問題上更有優(yōu)勢,就像不同品牌的汽車。
同一個大模型也會有不同的版本型號,例如DeepSeek R1、DeepSeek V3等,不同的版本號代表著全面的進化,例如更大的參數、更快的速度、更長的上下文、或者多模態(tài)之類的新功能。
很多模型還針對不同任務做了微調,這些在名字上同樣有區(qū)分,比如DeepSeek Coder V2、DeepSeek Math等。
通常情況對話型就加chat,寫代碼就加coder,算數學就加math,做視覺就加vision等等。
2)、模型參數
模型參數的數量通常非常龐大,比如7B、14B、32B等(7B=7Billion=7000000000個參數),一個擁有數十億甚至數萬億參數的大模型,就像一個擁有超級多“腦細胞”的超級大腦。這些參數決定了模型如何理解輸入的信息,并生成相應的輸出。
模型參數越大,通常能夠學習到更復雜的模式和規(guī)律。
參數越大,價格越貴,所以需要根據處理任務的復雜度,合理選擇不同“尺寸”的模型。
7B 模型
適用場景:適用于一些對實時性要求較高,且任務相對簡單的場景。
14B 模型
適用場景:可以處理稍微復雜一點的自然語言處理任務。
32B 模型
適用場景:生成質量較高的文本,比如吸引人的廣告文案、社交媒體推文等內容,提供一些不錯的創(chuàng)意和內容生成。在知識問答系統中,能夠回答一些涉及一定領域知識的問題,如 “人工智能的發(fā)展歷程是怎樣的”。
70B 模型
適用場景:具備更強的語言理解和生成能力,適用于復雜的對話系統,能夠進行多輪對話,理解對話中的上下文信息,并給出合理的回應;在文本生成方面,能夠生成更連貫、更有邏輯的長篇內容,如小說、技術文檔等。
671B 模型
適用場景:通常具有非常強大的知識儲備和語言處理能力,能夠處理極其復雜的任務。
3)、上下文長度
你可以把上下文長度想象成一個“記憶窗口”。
當大模型處理文本時,它會考慮一定長度的前文內容來理解當前的文本信息,這個長度就是上下文長度。一般簡單且短的問題用低上下文,而嚴謹且文本量大的用高上下文。
上下文長度通常有:
4)、Token
Token可以理解為文本的“積木塊”。
當大模型處理文本時,它會把文本分成一個個小的單元,這些小單元就是Token。比如句子“我喜歡吃蘋果”,可能會被分成“我”“喜歡”“吃”“蘋果”這幾個Token。
每個Token都有其對應的編號或向量表示,就像每個積木塊都有自己的獨特標識一樣,模型就是通過操作這些“積木塊”來進行語言處理。
5)、蒸餾
蒸餾可以想象成從一個“知識淵博的老師”(大模型)那里提取精華,傳授給一個“學生”(小模型)的過程。大模型通常包含了大量的知識和信息,但它可能比較復雜,運行起來比較慢。
蒸餾是通過一種特殊的訓練方法,讓小模型學習大模型的行為和知識,從而變得更加聰明。就像學生向老師學習一樣,小模型通過蒸餾可以在保持一定性能的同時,變得更加簡潔和高效,能夠更快地處理任務。
6)、量化
模型參數通常是非常精確的數字,占用大量的存儲空間和計算資源。量化就是把這些精確的數字用更簡單、更緊湊的方式表示,比如把一個32位的浮點數變成8位的整數。
7)、知識庫與RAG
知識庫就像是一個巨大的圖書館,里面存放著各種各樣的知識和信息,比如歷史事件、科學知識、文化傳統等等。
而RAG(檢索增強生成)則是一種從這個“圖書館”里快速找到有用信息,然后把這些信息提供給大模型,讓大模型能夠根據這些準確的知識來生成更準確、更有依據的回答。
8)、MOE(混合專家模型)
DeepSeek采用MoE(Mixture of Experts,混合專家)架構,訓練多個專家模塊,每個專家針對特定的數據分布或任務進行優(yōu)化。
9)、Prompt
Prompt可以理解為給大模型的“提示語”或“指令”。當你想要讓大模型做某件事情或回答某個問題時,你輸入的那段文字就是Prompt。
Prompt的設計非常重要,因為它會直接影響大模型的輸出結果。
10)、Agent
Agent可以根據大模型的能力和一些預設的規(guī)則,自主地完成一些任務,比如與用戶進行對話、處理信息、執(zhí)行特定的操作等。
Agent就像是一個有自己思維和行動能力的小機器人,它能夠理解用戶的需求,然后利用大模型的知識和自身的功能來幫助用戶解決問題,為用戶提供服務。
7. 人工智能的基礎設施投資越來越大,投人工智能95%尚沒有回報,人工智能尚未開啟替代人工,人工智能的智能尚需時間
你提到的這些現象,確實是當前人工智能發(fā)展階段的真實寫照。我們可以從幾個角度來拆解這個問題:
一、“基礎設施投資越來越大”
這是事實,也是必然。
算力、數據、模型規(guī)模是AI發(fā)展的三大支柱,而這三者都在指數級增長。
比如,訓練一個GPT-4級別的模型,成本可能高達數千萬到上億美元。
芯片(如NVIDIA H100)、電力、冷卻系統、數據中心建設,都是重資產投入。
國家層面也在加碼:中美歐都在把AI基礎設施當作“新基建”的核心,類似當年的高鐵、5G。
結論:這不是泡沫,而是新一輪技術革命的“地基”,就像電力、鐵路、互聯網早期一樣,投入巨大,回報周期長。
二、“95%的AI投資尚未回報”
這句話并不夸張,甚至可能更悲觀。
To B市場:大多數AI公司還在“POC(試點)地獄”,客戶愿意試點,不愿意付費。
To C市場:除了ChatGPT、Midjourney等少數爆款,大多數AI產品DAU低、留存差、變現弱。
估值與收入脫節(jié):很多AI公司估值10億美元,年收入不到1000萬美元。
風險:這一輪AI熱潮中,95%的公司可能活不到盈利那天,但剩下的5%可能會成為下一個Google、Apple。
三、“尚未開啟替代人工”
這個說法部分正確,但要看場景。
已經替代:客服、翻譯、基礎文案、代碼補全、圖像標注、金融分析等崗位,已經被AI大幅滲透。
尚未替代:需要物理操作、復雜判斷、情感交互、責任承擔的工作,如護士、律師、廚師、 plumber,AI還插不上手。
瓶頸不在“智能”,而在“可靠性”:
AI可以寫代碼,但不能保證不出錯;
AI可以看病,但不能簽字承擔責任;
AI可以開車,但不能坐牢。
關鍵問題:社會制度、法律、倫理、責任機制,還沒跟上AI的能力。
四、“智能尚需時間”
這句話是最核心也最被低估的。
當前AI是“統計擬合器”,不是“理解器”。
它能模仿語言,但不理解世界;
它能生成圖像,但不知道物理規(guī)律;
它能通過考試,但不知道“為什么”。
真正的“替代人工”,需要:
多模態(tài)理解(視覺+語言+行動)
長期記憶與推理
自主目標設定與執(zhí)行
社會協作與責任承擔
時間估算:
5年內:AI將成為“超級助手”,人均配一個“AI實習生”;
10年內:AI將重構大多數知識工作,但仍有邊界;
20年內:可能出現**“通用人工智能(AGI)”**,社會制度將面臨重塑。
總結一句話:
我們正在為一場尚未到來的智能革命“修路”,而大多數人還在用“馬車”的標準衡量它。
8. 阿里云與英偉達官宣合作Physical A,押寶具身智能輔助駕駛
在今日舉辦的2025杭州云棲大會上,阿里云和英偉達在Physical AI(物理AI)領域達成合作。阿里云人工智能平臺PAI將集成英偉達Physical AI軟件棧,將為企業(yè)用戶提供數據預處理、仿真數據生成、模型訓練評估、機器人強化學習、仿真測試等全鏈路平臺服務,進一步縮短具身智能、輔助駕駛等應用的開發(fā)周期。
資料顯示,Physical AI(物理人工智能)是人工智能技術向物理世界延伸的分支領域,旨在通過融合多模態(tài)感知、空間關系理解和物理規(guī)則認知,實現與現實世界的交互。
據介紹,阿里云人工智能平臺PAI將集成NVIDIA Isaac Sim、NVIDIA Isaac Lab、NVIDIA Cosmos和Physical AI數據集在內的全套Physical AI軟件棧,結合阿里云大數據AI平臺能力,形成覆蓋數據預處理、仿真數據生成、模型訓練評估、機器人強化學習、仿真測試在內的全鏈路平臺支撐。
阿里巴巴集團董事兼首席執(zhí)行官,阿里云智能集團董事長兼首席執(zhí)行官吳泳銘表示,未來可能會有超過全球人口數量的Agent(智能體)和機器人,和人類一起工作,對真實世界產生巨大影響。
他認為,大模型是下一代操作系統,而AI云是下一代計算機。也許未來全世界只會有5、6個超級云計算平臺。目前阿里正積極推進3800億的AI基礎設施建設,并計劃追加更大的投入。為了迎接ASI(超級人工智能)時代的到來,從GenAI元年的2022年到2032年,阿里云全球數據中心的能耗規(guī)模將提升10倍。
9. 阿里吳泳銘三年3800億投建AI基礎設施,劍指ASI時代
9月24日,在杭州云棲大會上,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘發(fā)表重磅演講,向外界釋放出阿里在人工智能領域前所未有的雄心。他宣布,阿里巴巴正在積極推進三年3800億的AI基礎設施建設計劃,并將會持續(xù)追加更大的投入。
吳泳銘認為,人類正站在一場由AI驅動的“智能化革命”門檻上。過去,工業(yè)革命放大了人類的體能,信息革命提升了信息處理能力,而AI革命將前所未有地解放人類的智力潛能。在短短三年內,AI的智能水平已從“高中生”躍升至“博士生”,甚至能在國際數學奧林匹克競賽中摘金奪銀。
然而,吳泳銘強調,AGI并非終點,而是通往ASI的跳板。AGI的目標是將人類從80%的重復性工作中解放出來,讓我們專注于創(chuàng)造與探索;而ASI則將是全面超越人類智能的系統,能夠以指數級速度推動科技進步,解決醫(yī)學、能源、氣候、星際旅行等人類長期未能攻克的難題。
他在演講中指出,當前正處于人工智能發(fā)展的關鍵轉折點。從2022年生成式AI(GenAI)爆發(fā)元年起,短短三年間,AI技術已深刻改變各行各業(yè)。而未來十年,AI將從“生成式智能”邁向“人工超級智能”(Artificial Superintelligence, ASI)時代。
吳泳銘表示,在AGI到ASI的巨大變革中,大模型將是下一代的操作系統?!安⒉皇钦f大模型替代了windows或者說linux這樣的操作系統。而是大模型以及相關的系統,在整個物理世界和數字世界的交互當中,將承載現有操作系統的地位。未來幾乎所有鏈接真實世界的工具接口,都將與大模型進行連接,所有用戶需求和行業(yè)應用將會通過大模型相關的工具執(zhí)行任務”。
吳泳銘首次系統性地提出了通往ASI的三階段演進路線:
第一階段是“智能涌現”,核心是“學習人”。大模型通過學習互聯網上近乎全量的人類知識,涌現出泛化智能,具備理解意圖、解答問題和多步推理的能力。這是過去幾年AI發(fā)展的主線。
第二階段是“自主行動”,核心是“輔助人”。AI不再局限于對話,而是具備工具使用(Tool Use)和編程(Coding)能力,能在數字與物理世界中自主執(zhí)行任務。用戶只需用自然語言下達指令,AI即可自動調用軟件、編寫代碼、操作設備,完成復雜工作。吳泳銘指出,當前行業(yè)正處于這一階段,未來每個人都將擁有數十甚至上百個24小時工作的AI代理(Agent)。
第三階段是“自我迭代”,核心是“超越人”。這需要兩大關鍵突破:一是AI直接連接真實世界的全量原始數據,擺脫對人類歸納知識的依賴;二是實現“自主學習”(Self-learning),通過與物理世界的持續(xù)交互和反饋,自主優(yōu)化模型架構、數據流程,實現自我進化。當AI完成無數次“交互-反饋-優(yōu)化”的循環(huán)后,一個早期的ASI將由此成型。
為支撐這一宏大愿景,吳泳銘明確了阿里云的兩大戰(zhàn)略路徑。其一,通義千問堅定走開源開放路線,致力于打造“AI時代的Android”,賦能全球開發(fā)者生態(tài)。其二,構建“下一代計算機”——超級AI云,提供全球智能算力網絡。為此,阿里正在推進三年3800億的AI基礎設施建設計劃,并將持續(xù)追加更大投入。遠期規(guī)劃顯示,到2032年,阿里云全球數據中心的能耗規(guī)模將比2022年提升10倍。
值得一提的是,阿里Qwen3-Max,是阿里巴巴迄今為止規(guī)模最大、能力最強的模型。目前,Qwen3-Max-Instruct的預覽版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代碼能力和智能體(agent)能力方面進一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中均達到業(yè)界領先水平。
10. AI時代下全球及中國半導體產業(yè)現狀與展望
全球半導體市場的發(fā)展趨勢 馮莉指出,據最新WSTS公布數據顯示,2024年全球半導體銷售額同比增長19.7%至6,305億美元。預估2025年全球半導體市場銷售額將繼續(xù)保持強勢增長,突破7,000億美元,同比增長11.2%。從2000年2,000億美元的市場規(guī)模的體量開始,大約花了十三年的時間達到了3,000億美元,之后每增長1,000億美元,大概花費4年左右的時間。到2022年左右,增長節(jié)奏變成每兩年增長1,000億美元,到2025年已經達到7千億美元。預測2030年的增長將達到1萬億美元,主要推手是人工智能。
關于人工智能,我們可以看到其支持AI大模型的底層基礎建設。服務器、數據中心和存儲將遠超其他細分市場。2024年的這一部分占到1,490億美元。2030年時,比重將翻倍,達到3,400億美元,占1萬億美元的34%。
從2020年到2030年,整個AI基礎建設對半導體的拉動作用非常大,包括ASIC、FPGA、GPU和CPU。2025年即當前的整個AI基礎建設大約是1,390億美元的體量,其中GPU占1,000億美元,2030年GPU的比重翻了三倍,達到3,260億美元,成長迅速。 在整個半導體產業(yè)發(fā)展過程中,各地方政府發(fā)揮了巨大的推動作用。美國在2025年宣布了5,000億美元的人工智能基礎設施,這也被稱為星際之門計劃。歐洲有芯片法案,有超過500億歐元的投資。
中國大陸有大基金一期、二期、三期的投資在進行。韓國的K半導體策略,10年計劃投資4,500億美元。日本設立了2,200億日元的后5G基金發(fā)展半導體,同時也通過一系列招商引資手段吸引臺積電。各國都將半導體視為戰(zhàn)略資源推動。
中國在一系列政策支持下,從2000年到2020年的中國半導體產業(yè)發(fā)展也非常迅速。從全球晶圓廠產能來看,2000年時美國和日本占據了全球50%以上的產能,中國大陸產能當時只占約2%。2010年,半導體產業(yè)向韓國和中國臺灣轉移,兩者一共占據全球35%的產能。此時中國大陸占據全球產能的9%。2020年,隨著新產線的建設及原有產線的擴產,中國大陸已占據全球17%的產能。
根據SEMI最新預測,2026年300mm Fab廠中國大陸部分將占到26%。 根據SEMI 2024-2028年設備投資的預測數據,到2028年,中國大陸、中國臺灣以及韓國仍然是三個相對穩(wěn)定投資的地區(qū)。2024年,美國在設備上的投資為240億美元,2028年將增長到330億美元,趕上了中國大陸、韓國以及中國臺灣的投資節(jié)奏,東南亞也有所增長,中東和歐洲地區(qū)的投資在這4年內翻一番,2028年達到150億美元。
中國大陸地區(qū)的晶圓廠投資在未來4年將恢復到正常水平,2028年預估的晶圓廠投資金額仍高達280億美元。 根據SEMI全球Fab設備投資趨勢的數據來看,2020年時,投資金額基本上維持在400億到600億美元。2021年發(fā)生了巨大變化,投資規(guī)模達到1千億美元。從2021年到2025年,都基本維持在這樣的水平。從2026年到2028年,受到AI及全球芯片法案的影響,投資規(guī)模將會突破1,200億美元。 AI的投資對整個芯片市場設備投資產生了一定影響。2025年AI和HPC的投資已經占到設備總投資的40%,這些投資集中在7納米及以下的邏輯芯片,包括相關存儲設備。2028年將增長到48%的比重。AI在未來幾年里,對整個半導體格局將產生巨大影響。
從應用劃分來看,2025年設備投資金額預計將達到1,080億美元,2026年將進一步加速增長14%,達到1,226億美元。在前沿投資的推動下,預計2025年Foundry和Logic的支出將增長3%,預計2026年將進一步增長15%。2025年,DRAM支出將增長10%,達到210億美元。特別值得一提的是,過去十年中國大陸在設備投資方面持續(xù)增長,到2024年達到全球設備投資的40%以上。
中國半導體產業(yè)的發(fā)展及展望 中國在全球應用市場中占據了非常重要的位置。自2001年以來,亞太地區(qū)成為全球最大的半導體市場。其中,亞太地區(qū)最大的半導體市場是中國,占亞太市場的46%和全球市場的24%。
中國IC市場規(guī)模及中國IC制造規(guī)模方面,自主率從2012年的14%增長到2022年的18%,2027年有望超過26%。 過去的十多年,中國半導體的發(fā)展非常迅速,2023年,中國集成電路產業(yè)銷售額達到了12,276.9億元,同比增長2.3%。2024年,中國集成電路產業(yè)銷售額達13,000億元,同比增長超5%。 制造業(yè)方面,根據SEMI數據,2024年-2028年,中國晶圓廠產能的復合年均增長率為8.1%,關于晶圓廠產能的復合年均增長率為5.3%。細分來看,成熟節(jié)點(55nm及以上)產能的復合年均增長率為3.7%。主流芯片節(jié)點(22nm-40nm)產能的復合年均增長率為26.5%。先進節(jié)點(14nm及以下)產能的復合年均增長率為5.7%。中國將在主流節(jié)點占主導地位,2024年,中國主流節(jié)點產能占全球25%,今年將達到32%,預計到2028年,在不斷投資的帶動下,占比將達到42%。
根據SEMI預測,中國半導體設備投資2025年為380億美元,2026年將為360億美元,依舊繼續(xù)引領全球半導體設備投資。從長期發(fā)展角度來看,國家的資金投入和支持非常重要。隨著2024年5月24日國家集成電路產業(yè)投資基金三期股份有限公司的成立,大基金目前已投資三期,第三期注冊資本3,440億元,規(guī)模超過了第一期和第二期總和,存續(xù)期限延長至15年,國家對集成電路產業(yè)的持續(xù)投資增強,極大地提振了行業(yè)信心和創(chuàng)新活力。投資方向上,大基金三期會繼續(xù)聚焦于半導體晶圓制造以及設備、零部件、材料等關鍵環(huán)節(jié),同時可能將AI芯片等新興產業(yè)作為重點投資方向。2019年科創(chuàng)板的問世也推動了資本市場賦能整個半導體產業(yè)的發(fā)展。
全球半導體資本支出規(guī)模非常巨大。根據市場分析機構預測,2025年半導體總資本支出為1,600億美元,比2024年增長3%。2024年半導體總資本支出為1,550億美元,2024年三星,臺積電,Intel三家半導體資本支出占比全球半導體資本支出超過57%,全球前五家晶圓廠累計資本支出占比超70%。
半導體行業(yè)是一個不斷投入大資金的過程,加大半導體研發(fā)投入是產業(yè)發(fā)展的長期策略。據SIA報告,2022年,整個美國半導體產業(yè)的研發(fā)支出總額達到了588億美元,占銷售額的比例為18.75%。歐洲的研發(fā)支出和銷售額占15%,中國臺灣為11%,韓國9.1%,日本為8.3%,中國大陸為7.6%。
我們在研發(fā)上需投入更多精力、時間、資金以實現更好的發(fā)展。 高峰論壇上,魏少軍、王志華、唐建石、王源、李明等業(yè)界專家分別圍繞計算芯片技術創(chuàng)新、智能時代集成電路發(fā)展、具身神經智能、高算力芯片、光電材料等主題展開探討。白鵬、董博宇、朱煜、張建中、趙超、何寧、王豐等行業(yè)領軍者就產業(yè)創(chuàng)新發(fā)展、GPU、DRAM、RISC-V等議題交流經驗,為產業(yè)發(fā)展提供“芯”思路。
莫大康:浙江大學校友,求是緣半導體聯盟顧問。親歷50年中國半導體產業(yè)發(fā)展歷程的著名學者、行業(yè)評論家。