半导体周报0121-半导体之CPU
半导体周报-0114
一、行业新闻及动态
1、半导体设计:
财联社1月9日电,英伟达推出了三款带有额外组件的新型桌面级GPU,这些芯片令游戏玩家、设计师和其他计算机用户能够更好地利用个人电脑上的AI,而无需依赖通过互联网访问的远程服务。该公司周一在国际消费电子展上表示,这些芯片是现有产品的更新版本,将以“很棒的新价格”面世。新的GeForce RTX 4080 SUPER将获得更多的处理核心和更快的内存。该公司表示其运行Stable Diffusion XL图像生成软件的速度比上一代英伟达技术同类机型快1.7倍。这款产品定于1月31日上市,售价为999美元。该公司还推出了售价799美元的RTX 4070 Ti SUPER和售价599美元的4070 Super,二者将于本月晚些时候上市。
《科创板日报》10日讯,英特尔表示,将推出最新人工智能(AI)PC芯片的汽车版本,在半导体市场上与高通和英伟达展开竞争,它可以为未来汽车的大脑提供动力。英特尔还表示,将收购法国初创公司Silicon Mobility,该公司设计用于控制电动汽车电机和车载充电系统的SoC技术和软件。
据WIND报道,索尼和本田合资的索尼本田移动公司宣布:与美国微软公司在开发利用生成式人工智能的对话型服务项目上合作,力争将该AI服务引进正在研发的纯电动汽车“AFEELA”中,并计划利用OpenAI的语言模型。
2、半导体制造及封测:
财联社1月10日电,记者获悉,采用NVIDIA DRIVE Thor超级芯片首发搭载的极氪新车将于2025年上市,该单颗芯片算力达到2000 TOPS,性能约是目前主流的英伟达Orin芯片的8倍。在CES 2024展会上NVIDIA透露,极氪将在全新的全栈自研自动驾驶系统上采用NVIDIA DRIVE™ Orin平台。
《科创板日报》12日讯,日本半导体设备大厂Disco开发出一款新型SiC(碳化硅)晶圆切割设备DFG8541,可加工最大尺寸为8英寸的硅和碳化硅晶圆,并将SiC晶圆的切割速度提升至原来的10倍。
据央广网报道,量子计算芯片安徽省重点实验室、安徽省量子计算工程研究中心联合发布我国最新的自主可控超导量子芯片——“悟空芯”(夸父KFC72-300),该量子芯片已在近期发布的中国第三代自主超导量子计算机“本源悟空”上运行,拥有72个超导量子比特/能够实现量子叠加和纠缠等特性,该量子芯片的发布标志中国自主超导量子计算机制造能力从小规模开始进入中等规模阶段。
3、其他:
《科创板日报》10日讯,美国半导体行业协会(SIA)宣布,2023年11月全球半导体行业销售额总计480亿美元,比2022年11月的456亿美元总额增长5.3%,比2023年10月的466亿美元总额增长2.9%。
二、本周话题——逻辑芯片之CPU
CPU 是计算机的运算和控制核心。CPU是对计算机的所有硬件资源进行控制调配、执行通用运算的核心硬件单元。计算机系统中所有软件层的操作,最终都将通过指令集映射为 CPU 的操作。CPU 由运算器、控制器、寄存器及实现他们之间联系的数据、控制及状态的总线构成。运算逻辑部件可以执行定点或浮点算术运算操作、移位操作以及逻辑操作,也可以执行地址运算和转换。寄存器部件包括通用寄存器、专用寄存器和控制寄存器,分别用于保存指令中的寄存器操作数和操作结果、执行一些特殊操作、用来指示机器执行的状态。控制部件负责对指令译码,并发出完成每条指令所要执行的各个操作的控制信号。
CPU 的运行原理
资料来源:电子发烧友,东吴证券研究所
按照体系结构进行划分,可分为冯·诺依曼结构和哈佛结构。两者的区别在于程序空间和数据空间是否一体,冯·诺依曼结构的数据空间与程序空间不分开,而哈佛结构的数据空间与程序空间分开。现代的复杂芯片中,大多是冯·诺依曼结构和哈佛结构融合或者并存的体系。改进的哈佛结构:其具有独立的地址总线和数据总线,两条总线由程序存储器和数据存储器分时共用。并使用公用数据总线来完成程序存储模块或数据存储模块与 CPU 之间的数据传输。相对于哈佛结构,合并了两个存储器的地址总线和数据总线。
按照应用领域划分,CPU 可以分为微处理器(MPU)、微控制器(MCU)、数字信号处理器(DSP)、专用处理器(ASP)。
微处理器(MPU):MPU 涵盖的范围比 CPU 小,小型的处理器都可以被称作 MPU。MPU通过较为强大的运算和处理能力执行较为复杂的大型程序,可以视作是功能增强的 CPU。往往被用作个人计算机和高端工作站的核心 CPU。
微控制器(MCU):MCU 也就是俗称单片机,是专门用作嵌入式应用而设计的单芯片型计算机,是将计算机的 CPU、RAM、ROM、定时计数器和多种 I/O 接口集成在一片芯片上从而形成的芯片级计算机,是随着大规模集成电路的出现而产生的。
数字信号处理器(DSP):DSP 是由大规模或超大规模集成电路芯片组成的用来完成数字信号处理任务的处理器。DSP 不只局限于音视频层面,也应用于通信与信息系统、自动控制、雷达、军事、航空航天、医疗等领域。DSP 是为适应高速实时信号处理任务的需要而发的,解决了微处理器器件较多、逻辑设计和程序设计复杂、价格较贵等问题,实现了对信号的采集、变换、滤波、估值、增强、压缩、识别。
专用处理器(ASP):ASP 是一张针对于特定领域设计的处理器,比如用于 HDTV、ADSL、Cable Modem 等的专用处理器。
指令集及CPU架构:
指令集是 CPU 中用来计算和控制计算机系统的一套指令的集合。CPU 在设计时就定下了一系列与其他硬件电路相配合的指令系统,不同指令集使得 CPU 发挥不同的性能,是 CPU 性能体现的重要标志。包含了基本数据类型、指令集、寄存器、寻址模式、存储体系、中断、异常处理以及外部 I/O,一系列的 opcode 即操作码(机器语言),以及由特定处理器执行的基本命令。按照采用的指令集,CPU 可以分为复杂指令集(CISC)和精简指令集(RISC)两大类。
CISC 指令集:即复杂指令集,在早期为了扩展计算机功能,需要将更多更复杂的指令加入指令系统,以提高计算机的处理能力,因此 CISC 强调增强指令的能力、减少目标代码的数量,但是指令复杂,指令周期长。程序中各条指令和指令中的各个操作都是按顺序串行执行的。优点在于控制简单,缺点是对于计算机各个部分的利用率不高,执行速度较慢,主要以 x86 架构为代表。
CISC 的数据通道
资料来源:CSDN、华泰研究
RISC 指令集:即精简指令集,随着半导体技术的发展,80 年代开始逐渐通过硬件的方式,而非通过扩充指令来实现复杂功能,指令规模逐渐缩小,指令进一步简化,RISC 开始应用。其强调尽量减少指令集、指令单周期执行,但是目标代码会更大。与传统的 CISC 型相对而言,RISC 型的指令格式统一且指令种类较少,显著提高了处理速度,主要为 ARM、MIPS、RISC-V 等架构。
RISC 的数据通道
资料来源:CSDN、华泰研究
扩展指令集能够提升 CPU 的某一方面的性能。扩展指令集重新定义了新的数据和指令,从而能够极大提高该方面数据处理能力,但需要有软件支持,常见扩展指令集有 MMX、SSE、SSE2、SSE4。
CISC与RISC对比
资料来源:方正证券研究所
主要架构:
当前 X86 架构生态占据全球主要市场份额。微软公司和英特尔公司各自凭借自身规模效应和技术优势,使其产品 Windows 和 Intel CPU 占据了绝大部分市场份额,结成了 “Wintel”技术联盟。传统支持 x86 的 Windows 具备长久的历史,从 80 年代发展至今,生态环境丰富,大量小众应用与程序都能够兼容。但 x86 架构功耗较大,同时通用寄存器数量少,寻址范围较小,计算机硬件的利用率低。而 Windows on arm 是 16 年开始微软与高通合作开发的支持 arm架构处理器的操作系统,Windows on arm 由于历史较短,软件生态不丰富,大量软件需要转译后运行,存在效率损失甚至兼容性问题。但 arm 架构寄存器数量多,寻址方式灵活,硬件执行命令效率更高,且功耗更低。
x86 架构生态丰富,arm 架构功耗低
资料来源:国金证券研究所整理
ARM 架构在高并发应用场景具有比较优势。ARM 芯片比 Intel x86 芯片具有更高的功率效率,并且功耗更低,性价比更高。以 ARM 为代的 RISC 通用架构处理器在场景多样化计算时代具备明显的优势。例如在分布式数据库、大数据、Web 前端等高并发应用场景,单芯片核数更多的 ARM 架构处理器相比传统处理器拥有更好的并发处理效率。
ARM 生态繁荣。在移动设备领域,ARM 架构有着压倒性的市场和技术优势,根据软银 2017 年世界大会的数据,ARM 在智能手机、调制解调器、车载信息设备、可穿戴设备等领域都占据统治地位。基于海量的市场空间,目前芯片领域的新工艺、新制程和新材料都率先在 ARM 架构上得以实现。可以预见未来 ARM 架构的 CPU 在并发性能、功耗、集成度等方面都会长期保持领先优势。
X86 处理器目前主要厂商为英特尔与 AMD,2017 年 AMD 推出新的 Zen 微架构后,依靠性价比优势,市占率不断提升。 AMD 在 PC 端的成功主要来自于架构升级带来的性能、功耗、灵活性的提升,以及采用台积电代工带来的生产成本和制程优势。目前英特尔新一代 Meteor Lake CPU 采用了创新的架构,能耗更佳,未来也具备迭代的灵活性,同时 Meteor Lake 部分内核采用台积电代工,在制程上未来有望拉平与 AMD 的差距。未来英特尔有望在 PC CPU 市场保持甚至提升份额。
23Q3 AMD 在 PC x86 处理器出货市占率 35.1%,英特尔为 62.6%
资料来源:Statista,国金证券研究所
根据 Statista,2017 年一季度时,按照出货量口径计算,AMD 的市占率为 18.1%。随着AMD 的 Zen 微架构的成功,使得 AMD 快速提升市场份额,2021 年一季度时 AMD 的市占率达到了 39.1%。虽然英特尔 2021 年开始微架构也有所升级,市场份额有所提升,但仍未能改变整体趋势。根据 Statista,2023 年三季度,AMD 的出货量市占率为 35.1%。从 PC CPU
的营收增速来看,AMD 也具备更高的增速。
AMD PC CPU 业务 21、22 年营收增速更快(单位:百万美元)
资料来源:Bloomberg。国金证券研究所
CPU生产流程:
CPU 的生产过程大致包括设计、流程、封测三大环节。设计是决定芯片功能、性能最为关键的环节。CPU 设计大致可以分为架构设计、电路设计、微码系统设计、安全模块设计、仿真模拟、产品设计、流片工艺设计、基板及封测工艺开发、硅后验证等环节。
流片和封测是芯片的实体制造过程。CPU 生产过程即在极高纯度的单晶硅片上,根据设计图纸即生产过程中表现形态为掩膜,进行雕刻,形成极其精细、复杂的电路。具体过程主要包括硅提纯、切割晶圆、影印、刻蚀、重复、分层、封装、多次测试等。
1)硅提纯:生产 CPU 现阶段主要的材料是 Si,这是一种非金属元素,从化学角度来看其位于元素周期表中金属元素与非金属元素的交界处,具备半导体性质,适合于制造各种微小的晶体管,是目前最适宜于制造现代大规模集成电路的材料之一。在硅提纯的过程中,原材料硅先被熔化并放入石英熔炉中,以便硅晶体围绕晶种生长。
2)切割晶圆:硅锭制作出来后被切割成片状,称为晶圆。用机器从单晶硅棒上切割下一片事先确定规格的硅晶片,并将其划分为多个细小的区域,每个区域都将成为一个 CPU 的内核(Die)。一般而言,晶圆切得越薄,相同量的硅材料能够制造的 CPU 成品越多。
3)影印:在经过热处理得到的硅氧化物层上面敷涂一种光阻物质,紫外线通过印制着 CPU复杂电路结构图样的模板照射硅基片,被紫外线照射的地方光阻物质溶解。为了避免不需要曝光的区域也受到光的干扰,必须制作遮罩将这些区域进行遮蔽。
4)蚀刻:这是 CPU 生产过程中的重要操作,也是 CPU 工业中的重头技术。蚀刻使用的是波长很短的紫外光并配合很大的镜头,短波长的光将透过这些石英遮罩的孔照在光敏抗蚀膜上使之曝光。接下来停止光照并移除遮罩,使用特定的化学溶液清洗掉被曝光的光敏抗蚀膜,以及在下面紧贴着抗蚀膜的一层硅。之后曝光的硅将被原子轰击,使得曝光的硅基片局部掺杂,从而改变这些区域的导电状态,以制造出 N 井或 P 井,结合制作的基片 CPU的门电路完成。
5)重复、分层:为加工新的一层电路,再次生长硅氧化物,沉积一层多晶硅,涂敷光阻物质,重复影印、刻蚀过程,得到含多晶硅和硅氧化物的沟槽结构。重复多遍,形成 3D 结构,每几层中间都要填上金属作为导体,层数决定于设计时 CPU的布局,以及通过的电流大小。
6)封装:将一块块的晶圆封入一个陶瓷或塑料的封壳中,以便装在电路板上。封装结构各有不同,好的封装往往能带来芯片电气性能和稳定性的提升,并能间接地为主频的提升提供可靠基础。
7)测试:这是 CPU 出厂前必要的过程,将测试晶圆的电气性能,检查是否出现了差错。之后晶圆上每个 CPU 核心都将被分开检测。由于 SRAM 结构复杂、密度高,所以缓存是CPU 中容易出问题的部分,对缓存的测试也是 CPU 测试的重要部分。
行业现状:
由于宏观经济压力导致的消费电子需求疲软,CPU市场规模在2022年有所下降,根据Gartner数据,2022年全球PC出货量达到2.86亿台,同比下降16.2%。Canalys通过对渠道伙伴PC库存调查得知,库存不足一周的渠道商自23年1月的33%增至6月的41%, 即2Q23库存情况进一步改善。在库存持续修正和季节性因素影响下,3Q23起PC市场有望逐渐开始复苏(据Yole、Canalys) 。
2019-2023E全球CPU市场规模及增速
资料来源:Yole Intelligence,德邦研究所
1Q18-2Q23全球PC出货量及增速
资料来源:Gartner,iFinD,德邦研究所
当下不论是在PC还是在服务器领域,x86都是主流选择。根据Mercury Research数据,1Q23消费级产品中x86架构市占率约为85.2%;另根据IDC数据,1Q23服务器中x86架构市占率为90.3%,使用x86架构能够更好的匹配当下的软硬件生态,降低应用迁移转换等适配工作成本。
4Q20-1Q23消费级产品x86架构市占率(按出货量)
资料来源:Mercury Research,德邦研究所
1Q18-1Q23服务器x86架构市占率(按销售额)
资料来源:IDC,Bloomberg,德邦研究所
CPU 可以应用在服务器、工作站、个人计算机 (台式机、笔记本电脑)、移动终端和嵌入式设备等不同设备上,根据应用领域的不同,其架构、功能、性能、可靠性、能效比等技术指标也存在一定差异。服务器具有高速的数据处理能力强大的 I/O 数据吞吐能力、良好的可扩展性,并需要长时间可靠运行,其 CPU 芯片在性能、可靠性、可扩展性和可维护性等方面要求较为苛刻。因此,服务器处理器是数据处理能力最强、设计工艺最复杂、可靠性最高的处理器。服务器的应用领域包括实时分析、5G 应用、人工智能、机器学习、金融、大数据和云计算等领域。
服务器 CPU 市场中Intel及 AMD 占据约九成的市场份额(出货量口径),共同构筑x86 垄断地位。根据IDC 数据,1Q23 全球服务器 CPU中Intel 出货量占比达 71.1%,AMD 出货量自2019 年开始快速增长,1Q23 占比达 17.3%,其他x86 架构 CPU 厂商的出货量占比仅为 1.8%。随着企业对于云端工作负载转趋多元,ARM 架构服务器 CPU 占比亦逐步提升,1Q23 出货量占比达9.6%。
1Q18-1Q23 全球不同 CPU 架构服务器出货量 (左轴单位: 百万台)
资料来源: IDC,Bloomberg,德邦研究所
AI 服务器蓬勃发展,有望成为服务器 CPU 市场的增长动力。根据 The next platform 预测,除非 AI模型增长减缓,或者 Al 训练和推理计算价格下降,否则有理由认为到 2026 年或 2027年A服务器有可能占到整人服务器市场收入的一半左右。根据台积电于 2Q23 业绩会上给出指引,目前,AI服务器处理器 (CPU、GPU 和 A 加速器) 的需求约占台积电总收入的 6%,未来 5年这一需求将以接近 50%的 CAGR 增长,占台积电收入的比例将上升到一几人百分点,随着 AIGC 应用快速发展带动 A 服务器需求提升,服务器 CPU 市场未来值得期待。
国产现状:
我国服务器市场快速增长,根据 IDC 数据,2022 年我国服务器市场市场规模为 288 亿美金(约 2016 亿人民币,按美元兑人民币汇率 7.0 来计),18-22 年 CAGR 达 20.2%,未来随着东数西算项目的推进、国产 AI 大模型/应用的爆发,国内服务器需求将稳步上升,预计 2027年将达到 454 亿美金(约 3178 亿人民币,按美元兑人民币汇率 7.0 来计),22-27年 CAGR 为 10%。
22 年中国服务器市场 288 亿美金,22-27 年 CAGR 10%
资料来源:IDC,国信证券经济研究所整理
根据 IDC 数据,2022 年中国 x86服务器市场规模为 270 亿美金(约 1890 亿人民币,按美元兑人民币汇率 7.0 来计),出货量为 377 万台;假设 CPU 价值量占服务器总价值量 28%,对应国内 529 亿人民币市场空间,x86 CPU 市场空间广阔。
22 年中国 x86 服务器市场规模达 270 亿美金
资料来源:IDC,国信证券经济研究所整理
国内服务器 CPU 市场:1)国内厂商起步相对较晚,中科系的龙芯 1 号 2002 年研发成功,华为 2014 年发布第一颗基于 ARM 的 64 位 CPU 鲲鹏 912 处理器,海光信息海光 1 号 2018 年实现量产,整体起步时间晚于海外龙头厂商。2)海外厂商垄断国内市场,根据 IDC 数据,从 23Q1 中国服务器 CPU 出货量来看,英特尔占比达79.8%,AMD 占比达 5.4%,合计占比达 85.2%。
竞争格局:
目前全球 CPU 市场呈现 Intel 和 AMD 寡头垄断格局,Intel 主导全球 CPU 市场。根据 CPU Benchmark 数据,在两公司整体 CPU 出货量中,2022 年 Q1 Intel 公司占据 64.8%的市场份额,AMD 占 35.1%。从出货量来看,目前全球 CPU 市场上 Intel 与 AMD 两大巨头基本实现了对市场的寡头垄断,中小 CPU 企业由于自身体量、资金、技术等限制,较难在现有格局下突围。此外,Intel 出货量市场份额接近 AMD 两倍,仍然在市场上占据主导地位。
移动终端 CPU 方面,联发科、高通领跑智能手机处理器市场。根据全球数据调研机构Counterpoint 发布的报告,2021 年 Q4 全球智能手机处理器中联发科占据市场份额 33%,高通以30%的市场份额位居次位,较2020年Q4有较大提升,苹果位列第三市占率为21%,华为海思受美国制裁影响,市场地位下降幅度较大,由 7%降至 1%。
国产CPU 企业目前主要有 6 家,分别是龙芯中科、电科申泰、华为海思、飞腾信息、海光信息、上海兆芯。按采用的指令系统类型可大致分为三类:(1)海光信息和上海兆芯,采用X86 指令系统: (2) 华为海思和飞腾信息,采用 ARN指令系统: (3) 龙芯中科和电科申泰,早期曾分别采用 MIPS 兼容的指令系统和类 Alpha 指令系统,现已分别自主研发指令系统。海光 CPU 系列产品兼容 x86指令集以及国际上主流操作系统和应用软件,软硬件生态丰富,相较于其他服务CPU 厂商来说,有望在国产服务器替换及新增需求中获得相对更大的市场份器额
国信证券:海光信息(688041.SH):以 CPU 业务为基,横向拓展 AI 芯片业务,国产 AI 芯片迎历史机遇期
德邦证券:海光信息 (688041.SH): 国产CPU+DCU 龙头,信创+AI 双轮驱动高速增长
国金证券:AI PC 元年到来,看好 PC CPU 及配套芯片厂商发展