半导体周报0407-算力行业(1)

创建时间:2024-04-08 12:23

半导体周报-0407

一、行业新闻及动态

1、半导体设计:

财联社3月18日电,据美国趣味科学网站14日报道,美国芯片初创企业Cerebras Systems推出了全新的5纳米级“晶圆级引擎3”(WSE-3)芯片。该公司官网称,这是目前世界上运行速度最快的人工智能(AI)芯片,将此前纪录提高了1倍。WSE-3拥有4万亿个晶体管,也使其成为迄今最大的计算机芯片,专门用于训练大型AI模型,未来也有望用于目前正在建设中的“秃鹰银河3号”AI超级计算机。

 

财联社3月19日电,英伟达首席执行官黄仁勋展示了旨在巩固该公司在人工智能计算领域主导地位的新芯片。该公司在加利福尼亚州圣何塞举行的GTC大会上表示,名为GB200的使用Blackwell架构的新处理器在处理支持人工智能的模型方面可以将速度提高数倍。这包括被称为训练阶段的技术开发过程和称为推理阶段的技术运行过程。由2080亿个晶体管构成的GB200芯片将成为亚马逊、微软、Alphabet Inc.旗下谷歌、甲骨文等全球最大数据中心运营商部署的新计算机和其他产品的基石。Blackwell以美国国家科学院首位黑人学者David Blackwell的名字命名。由于其前一代产品Hopper的巨大成功,Blackwell将面临着续写辉煌的挑战。

 

《科创板日报》21日讯,三星电子 DS(设备解决方案)部门负责人庆桂显宣布,三星电子计划今年底明年初推出采用LPDDR内存的AI芯片Mach-1。Mach-1芯片已完成基于FPGA的技术验证,正处于SoC设计阶段。该AI芯片将于今年底完成制造过程,明年初推出基于其的AI系统。Mach-1芯片基于非传统结构,可将片外内存与计算芯片间的瓶颈降低至现有AI芯片的1/8。此外,其无需现在紧俏而昂贵的HBM内存,而是选用了LPDDR内存。

 

2、半导体制造及封测:

《科创板日报》19日讯,中微公司董事长、总经理尹志尧在2023年度业绩说明会上表示,在逻辑集成电路制造环节,公司开发的12英寸高端刻蚀设备已运用在国际知名客户最先进的生产线上并用于5纳米、5纳米以下器件中若干关键步骤的加工;同时,公司根据先进集成电路厂商的需求持续进行设备开发和工艺优化。在3D NAND芯片制造环节,公司的等离子体刻蚀设备已应用于128层及以上的量产,同时公司根据存储器件客户的需求正在开发极高深宽比的刻蚀设备和工艺;公司也根据逻辑器件客户的需求,正在开发更先进刻蚀应用的设备。

 

《科创板日报》21日讯,半导体封测厂商日月光3月21日宣布,推出小芯片(Chiplet)新互联技术,以应对人工智能发展带来的多样化小芯片整合设计和先进封装。该技术通过微凸块(microbump)技术使用新型金属叠层,可将芯片与晶圆互联间距大幅缩小。日月光表示,提升小芯片级互联技术可开拓应用领域,除了AI芯片之外,也可扩展至手机应用处理器、MCU微控制器等关键芯片。

 

《科创板日报》21日讯,意法半导体宣布与三星联合推出18nm FD-SOI工艺。该工艺支持嵌入式相变存储器(ePCM)。意法半导体表示,相较于其现在使用的40nm eNVM技术,采用ePCM的18nm FD-SOI工艺大幅提升了性能参数,其在能效上提升了50%,数字密度上提升了3倍。

 

《科创板日报》22日讯,SK海力士将于明年3月开始在韩国京畿道龙仁半导体集群建设半导体工厂(fab)。以此为开始,到2046年将投资超过120万亿韩元,总共建设4座晶圆厂。

 

财联社3月23日电,ASML供应商Newways周五表示,将在马来西亚巴生建造一座新工厂。工厂将于2024年第四季度投产,从而增强该公司在亚洲的产能。该公司在声明中表示,将专注于为半导体领域一些全球最著名的企业开发和生产先进的模块和机柜。Neways的发言人称,无法透露投资规模,但该公司打算将其在马来西亚的业务扩大到200名员工。

 

3、其他:

《科创板日报》20日讯,国际半导体产业协会(SEMI)报告显示,由于存储器市场的复苏以及高性能计算、汽车应用的强劲需求,全球应用于前道工艺的300mm晶圆厂设备投资,预计将在2025年首次突破1000亿美元,2027年将达到创纪录的1370亿美元。SEMI预测,2025年全球300mm晶圆厂设备投资将增长20%至1165亿美元,2026年增长12%至1305亿美元,2027年将将继续增长5%至1370亿美元。

 

二、本周话题——算力行业

        算力概念:狭义的概念上,算力是软硬件配合执行某种信息处理需求的能力。广义概念上,算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力,主要通过算力中心等算力基础设施向社会提供服务。

        信息计算力(Computational Power)是以计算能力为核心、支撑数据信息处理。在数字革命背景下,计算力是信息时代竞争的关键实力、数字经济时代的关键生产力,同时也成为挖掘数据要素价值、衡量生产力、推动数字经济发展的核心支撑和驱动力。

        网络运载力(Network Power)是以网络传输性能为核心、支撑数据要素高效流动。在东数西算背景下,运载力是赋能数字经济的关键力量,是优化算力供需关系的关键,是连接用户、数据和算力的桥梁。

        数据存储力(Storage Power)是以存储容量为核心、支撑数据存储和管理。存储力是支撑大数据时代的核心力量,是迅速访问信息、推动信息资源共享的基石。在数字经济快速发展的背景下,数据呈指数级增长,存储力作为承载数据的关键设施,重要性日益凸显。

算力分类:

        算力分为通用算力、智能算力和超算三种。其中,通用算力是基于搭载 CPU 芯片的服务器。智能算力即人工智能算力,是面向人工智能算法模型训练与运行服务的计算机系统能力。通常由 GPU、ASIC、FPGA、NPU 等各类专用芯片承担计算工作,在人工智能场景应用时具有性能更优、能耗更低等优点。超算算力是基于超级计算机等高性能计算集群,用于处理极端复杂或数据密集型问题。

算力分类

图形用户界面, 文本, 电子邮件

描述已自动生成

资料来源:《2022年中国算力白皮书》,首创证券

 算力的作用:

1)算力是数字经济的基础设施

算力全方位支撑数字经济

图表

描述已自动生成

资料来源:毕马威分析

        1)算力成为衡量数字经济发展关键指标全球范围内来看,算力对数字经济规模乃至 GDP 总量的带动作用愈发明显,信通院研究得出,2016-2021 年,全球算力规模平均每年增长 34%,数字经济规模和 GDP 每年分别增长 8%和 4%。作为全球数字经济主导力量之一,中国自 2012 年以来数字经济增速已连续 11 年显著高于 GDP 增速,2022 年数字经济规模更是首次突破了 50 万亿元。

        2)算力与数字产业化互为支撑一方面,算力底层融合了集成电路、服务器、数据中心、云计算、人工智能等数字化技术。例如,云计算将算力资源池化,推动算力成为覆盖端、边、云、网全架构场景的泛在能力,人工智能促进算力升级,算力与多模态感知技术融合实现智能化应用。另一方面,随着数字产业化由规模化发展转向高质量发展,大到 5G 通信、卫星互联网,小到出行线路规划、外卖订单系统优化、影视特效制作,都离不开算力支撑。从超级计算机、数据中心、云计算中心,到智能手机、智能电视等各类智能终端,算力专用性、可拓展性不断增强,有望与各类信息化技术相结合,充分实现性能功耗的平衡。

        3)算力加速产业数字化“数实融合”随着实体经济企业借助算力不断将产品、服务和业务流程转化为数据,数据要素深入渗透实体经济肌理,产业数字化转型的关键任务从“数字化”转变为“数智化”。在“数智化”阶段,决定数据要素价值的不再是如何生产数据,而是如何深入挖掘数据价值,不仅要持续消耗巨量算力,还对算力的质量、效率提出了更高要求。

        2)算力是通用人工智能的核心动力 AGI 发展来说,数据、算力、算法三大核心要素中,算力向下扎根于数据,向上支撑着算法,将是驱 AGI 发展的核心动力。深度学习出现之前,用于 AI 训练的算力增长大约每 20 个月翻一番,基本符合摩尔定律;深度学习出现之后,用于 AI 训练的算力大约每 6 个月翻一番;2012 年后,全球头部 AI 模型训练算力需求更是加速到每 3-4 个月翻一番,即平均每年算力增长幅度达到惊人的 10 倍;目前大模型发展如火如荼,训练算力需求有望扩张到原来的 10 到 100 倍,算力需求的指数级增长曲线将更加陡峭。这也意味着发展 AGI需要巨大的算力成本投入。

 

产业链分析:

        算力产业链上游涵盖由基础硬件、基础软件等,中游由第三方数据中心、云计算服务、网络运营服务、IT 外包服务、系统集成服务构成,下游为应用领域,由互联网、制造业、金融、能源等各行业企业用户构成。

算力产业链构成

表格

中度可信度描述已自动生成

资料来源:公开资料,毕马威分析

(一)、上游:

1)芯片:国产芯片厂商快速崛起,生态加速丰富

1)GPU:性能持续进化,价值量提升

        当前阶段,GPU 仍然是算力硬件的主流选项。以中国为例,按照 IDC 统计,2023 年上半年 GPU 服务器占据加速计算服务器 90%的比例,其余 NPU、FPGA 等形式的加速计算服务器占比为 10%,此前几 GPU 也一直是主流选项。

中国加速计算服务市场规模

图表, 条形图

描述已自动生成

资料来源:IDC,中信证券研究部

        GPU 市场当前的主导厂商依旧是英伟达,预计 H 系列是 2024 出货主力,B 系列是 2024 主要新看点。英伟达 GPU 产品线主要分为面向游戏娱乐领域的 GeForceGTX/RTX 系列显卡、面向专业设计和虚拟化领域的 NVIDIA RTX/Quadro 系列显卡,以及面向数据中心的高算力 GPU。根据英伟达官网,数据中心产品线目前在售产品主要包括 Ampere 系列,Hopper 系列,AdaLovelace 系列和 Turing 系列。从产品迭代节奏来看,2024 年 H100 系列将接替 A100 系列成为出货主力,有望支持英伟达数据中心产品线呈现量价齐升的局面。新产品方面,2024 年英伟达有望推出 B100 系列,该系列有望继续推动其产品价值量提升。

        GPU 市场仍将保持高增速,出货量与产品换代为主要因素。根据 Verified Market Research 的预测以及对英伟达营收的预测,2024 年全球的 GPU 市场规模(对应于 NVIDIA 的 FY25)将达到 800 亿美元以上,仍然保持高增速。其中出货量的增长以及产品的更新换代(价格提升)是主要的推动因素。

全球GPU市场规模(单位:亿美元)

图表, 条形图

描述已自动生成

资料来源:Verified Market Research,中信证券研究部

        HBM 是大模型时代发展重点,算力与存储、网络的配比将成为提效关键。从英伟达近期产品迭代来看,存储的进步较为重要。产品和投资意义上的大模型革命在 2022 年底到 2023 年左右才真正爆发,而此前的 A100 和 H100 系列产品设计定型时间更早,因此并非完全针对大模型极致优化的产品,在使用中可以发现其 HBM 存储往往成为瓶颈,算力利用率仍然有提升空间。因此,2023 年的 SC23 超算大会上,英伟达宣布推出 H200,主要的增强就在于采用新一代 HBM3e 芯片,据英伟达测试,这一措施大幅提高了产品的 AI 性能。预计存储有望成为 2024 年算力领域的一大主要发展方向。

        2)AI 芯片: GPU 外,其他专用 AI 芯片也是 2024 年发展的一大主要方向,将在一定程度上影响未来云端算力芯片的市场格局趋势,如今其高能效、低使用成本的特性已经是各家大厂的共识,可以在大规模部署(摊薄研发成本)的情况下获得更高的性价比,降低电力消耗。

        2023 年 12 月 7 日,AMD 推出最新数据中心芯片 Instinct MI300X GPU,在算力和显存方面均实现了 H100 的超越。算力方面,TF32(Sparsity)等指标是 H100 的 1.3 倍,FP64(Vector)等指标是 H100 的2.4 倍;显存方面,MI300X 有 192GB 的 HBM3 显存容量,容量是 H100 的 2.4 倍,显存带宽 5.3TB/s, H100 的 1.6 倍。

        另一方面,众多英伟达客户投入 ASIC 芯片研发中,ASIC 市场高速发展。ASIC 不同于 CPU、GPU、FPGA,目前全球 ASIC 市场并未形成明显的头部厂商。在庞大需求与有限供应的不对称影响下,一方面出于自身业务需求,另一方面寻求新的高利润增长点,许多云服务提供商以及新兴创业公司投入 ASCI

芯片研发中。根据贝哲斯咨询统计,2022 年全球 ASIC 市场规模到达到了 1005.51 亿人民币,预计2028 年市场规模将达到 1677.49 亿人民币,2022-2028CAGR9%。

        3)国产智能芯片硬件性能不断提升大模型装备竞赛下国内对高端算力芯片需求旺盛,BIS 加强对华高端半导体管控,英伟达多款高端算力芯片限制对华出售,高端算力芯片国产替代正当时。大模型能力的提升需要算力硬件进行支撑,算力充足与否,直接决定了 AI 产品供应商能否长期稳定的提供服务,从而保持行业竞争力。根据头豹研究所和沙利文联合发表的白皮书,2022 年中国 AI 芯片市场规模为 368 亿元,预计 2027 年将达到 3400 亿元,2022-2027CAGR56%。

中国AI芯片市场规模

图表

描述已自动生成

资料来源:头豹研究院,沙利文,首创证券

        国产智能芯片厂商可以大致分为两类,一类是华为、海光代表的,具有一定从芯片、服务器,到软件生态优势的大型厂商。另一类是以寒武纪、壁仞科技、摩尔线程、燧原科技等代表的国产智能芯片独角兽企业。

        智算芯片独角兽凭借优秀的创始研发团队,及精尖技术的积累异军突起。AI 芯片独角兽企业创始团队大多来自顶尖科研机构及国外科技公司,为公司提供了优秀的研发及技术基因。上市公司主要包括寒武纪,以及众多优秀的待上市企业。华为及部分 AI 独角兽企业智能芯片硬件性能正逐渐接近国外龙头厂商。

        4)国产芯片厂商软件生态仍在不断丰富,华为较为领先CUDA 生态是英伟达关键壁垒之一,国产厂商加速建立自身开发者生态。国外厂商英伟达除芯片硬件性能之外,软件 CUDA 生态亦是其重要壁垒。借助 CUDA,开发者能够利用 GPU 的强大性能显著加速计算应用。CUDA 工具包中包含多个 GPU 加速库、一个编译器、多种开发工具以及 CUDA 运行环境。国内厂商由于起步较晚,在开发者生态上与国外成熟产品仍有差距。在政府推动及下游产业支持下,国产芯片厂商开发者数量逐步上升,生态渐渐形成。

2)基础软件:关注数据库、操作系统等国产替代进展

        1)操作系统操作系统基本由美国微软、谷歌、苹果垄断,微软 Windows 基本垄断 PC 桌面操作系统市场,谷歌安卓基本垄断移动终端操作系统市场,苹果 iOS 凭借自身设备销售也占据一定市场份额。

        2)中间件:中间件是一种独立的系统软件服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。在大数据、物联网、云计算等新一代信息技术应用不断深化的背景下,中间件市场进入持续快速增长阶段,2022 年,我国中间件市场规模约为 96 亿元,增速为 8.23%。中间件和数据库、操作系统等捆绑销售以及开源和盗版存在,此外,信创产业的加速落地以及用户对于基于云的分布式应用服务、消息队列等因素驱动,中间件需求将不断增长,将会促进中间件市场的快速发展。

        3)数据库:数据库是我国“核高基”重大专项重点突破的核心产品之一。行业发展空间巨大,市场规模增长显著。根据大数据技术标准推进委员会,2022 年全球数据库市场规模为 833 亿美元,我国数据库市场规模(包含数据库周边生态)为 59.7 亿美元(约合 403.6 亿元人民币),占全球 7.2%。预计到 2027 年,我国数据库市场总规模将达到 1286.8 亿元,市场年复合增长率(CAGR)为 26.1%。从竞争来看,2022 年甲骨文、微软、IBM、SAP 四大国外企业市场集中约为 50%的市场份额。国内企业华为、阿里、达梦、人大金仓,占比约为 30%。

3)服务器:AI 算力需求持续增长,国产化占比提升

        1)通用服务器:海光与鲲鹏为第一梯队,ARM 架构仹额提升芯片需要服务器作为载体提供算力。从运营商近几年服务器集采招投标来看,国产化占比提升,海光与鲲鹏处于第一梯队。通过梳理 2020-2021 年及 2021-2022 年运营商服务器集采项目,能够测算得出运营商服务器集采中对信创服务器的采购比例已经提升至 30%左右,其中鲲鹏/海光系国产服务器第一梯队。

        2)AI 服务器需求持续,放量成长,ODM/JDM+液冷成为趋势2023 年全球 AI 服务器发展态势良好,并且在未来几年仍有望保持较好的发展态势。服务器环节受到产业链上下游发展影响较大,上游芯片合作方以及芯片技术演进、下游的客户合作关系和数据中心建设需求都能够较大程度影响行业发展。能够认为,由于云大厂在 AI 基建方面占据较高份额,有望助推白牌AI 服务器发展;同时由于 AI 计算的高功耗特性,液冷也成为未来发展的重点领域。

        AI 服务器整体发展趋势保持良好,销售规模持续提升。根据 IDC 统计,2020-2022 年期间全球服务器市场规模基本保持在千亿美元左右。The Next Platform 在 IDC 的基础上进行了进一步分类分析和预测,AI 服务器在 2023 年市场规模或有可能超过 400 亿美元,呈现跃变增长态势,并且在随后几年将大概率占据服务器市场一半以上的份额。

        国内份额方面,近年来浪潮、华三、宁畅等企业份额较高。根据 IDC《中国半年度加速计算市场》(2023 上半年)跟踪》报告,2023 年上半年从厂商销售额角度看,浪潮、新华三、宁畅位居前三,占 70%以上的市场份额;从服务器出货台数角度看,浪潮、坤前、宁畅位居前三名,占近 60%的市场份额;从行业角度看,互联网依然是最大的采购行业,占整体加速服务器市场超过一半的份额,此外金融、电信和政府行业需求均有超过一倍以上的增长。

2019-2022中国AI服务器市场份额

图表, 条形图

描述已自动生成

资料来源:IDC,中信证券研究部

4)光模块:高速、低功耗、LPO、CPO、硅光集成为未来发展趋势

        光模块相当于算力传输的大脑。光模块是实现光信号输入过程中光电转换和电光转换功能的光电子器件,光模块作为数据传输的通道,就像是网络世界里的高速公路,它的迭代升级就像是给高速公路扩宽,能让网络传输速度更快。目前光模块朝着高速、低功耗、LPO、CPO、硅光集成的趋势发展。

        1)高带宽:AI 光模块从 800G 向 1.6T 乃至更速率的发展作为目前数通光模块需求的主要驱动力,AI 对于网络带宽的要求不断提高,正在推动数通光模块向更高速进行发展。英伟达对于 H100 芯片的网络推荐配置是 800G 光模块(2*400G),所以我们看到 2023 800G 光模块需求不断提升,2024 年 800G 需求展望亦在不断提高。随着 B 系列等更高级算力芯片推出,网络需求将进一步被推高。根据 SemiAnalysis 曝出的一份英伟达未来几年的硬件路线图,预计 B系列 GPU 将于 2024 年推出,并于 2025 年放量,有望驱动 1.6T 产品(2*800G)的放量。而后 X 系列GPU 将于 2025 年推出,需求亦将进一步升级。谷歌同样预计 1.6T 产品将于 2024 年开始应用。

        2)低成本:低功耗方案关注度日益升高网络设备能耗问题随着传输速率增长而日益凸显,而在网络设备中光模块功耗对传输速率的增长最为显著。根据思科的数据,过去 12 年数据中心的网络交换带宽提升了 80 倍,背后的代价就是:交换芯片功耗提升约 8 倍,光模块功耗提升 26 倍,交换芯片 SerDes 功耗提升 25 倍。而光模块的整体功耗已经接近交换机系统功耗的一半,所以降低光模块的功耗已经成为 AI 实现低成本的重要问题之一。

        3)线性直驱方案(LPO)方案高速传统光模块中,通过 DSP 芯片对高速信号进行信号处理。DSP 虽然功能非常强大,但也带来很大的功耗和成本开销。例如 400G 光模块中用到的 7nm DSP 功耗约 4W,占整个模块功耗的接近 50%(R.Nagarajan, L. Lyubomirsky,O. Agazzi; et.al.)。线性直驱方案(LPO)中不再采用 DSP,只留下 driver TIA,而将 DSP 功能集成到交换芯片中。LPO 方案具备一系列优势,包括:(1)功耗低:相比于可插拔光模块,LPO 的功耗下降约 50%,交换机系统的整体功耗会下降 25%左右。(2)低延迟:由于不再采用 DSP,不涉及对信号的复原,整个系统延迟大大降低,可以应用到对延迟要求比较高的场景。3)低成本:去掉 DSP 后成本会下降。(4)易实现:LPO 仍然采用可插拔模块的形式,其可靠性高,维护方便,可以利用成熟的光模块供应链。

        4)光电共封方案(CPO)的方案CPO 方案借助硅光集成的工艺将光引擎、电芯片和交换机芯片封装在同一个基板上面,通过 TSV 的小孔来缩短封装电信号连接距离,有望同时实现高速率、高集成度、低功耗的方案。这是由于随着数据中心速率的提升,高速信号在印制电路板(PCB)传输中的损耗快速增加,传统交换机使用的可插拔光模块方案由于无法缩短电信号传输距离,难以满足合理的功耗要求,无法保证传输效果。同时缩短铜箔传输距离也可以减少电信号功耗,单位能耗有望从热插拔的 24pJ/bit 降低到 7pJ/bit,进而大幅降低电信号传输功耗。但是由于目前的技术与产业链尚不成熟等原因,短期内难以大规模应用,但看好其长期发展潜力。

(二)、中游:

        1)数据中心我国通用算力数据中心、智算中心持续加快建设。截至 2022 年底,我国在用数据中心机架规模超过650 万标准机架,年复合增长率超过 30%,平均上架率达 58%,在用数据中心服务器规模超 2000 万台。截至 2023 年 6 月,已投运智算中心 25 个、在建超过 20 个,各地依托智算中心支撑当地科研创新、人才培养及产业生态建设。

        2)云计算云计算是一种基于网络“云”的超级计算模式,在远程的数据中心里,成千上万台计算机和服务器联结成一片计算云。云计算模式取代企业原有 IT 自建模式,除了为企业用户提供存储、数据库、服务器及网络等基础 IT 资源服务(IaaS),并提供大量可计量的操作系统层面(PaaS)以及应用层面的软件服务SaaS)。

        2023 年国内云计算市场保持较快增长。据中国信通院,2023 年国内云计算市场规模 6192 亿元,同比增长 36%,2025 年国内云计算整体市场规模将突破万亿元。根据 Gartner,2023 年全球云计算市场规 5987 亿美元,其中中国市场约 6192 亿元(867 亿美元),占比全球市场 14%。

 

中国云计算市场规模 全球云计算市场规模

图表, 瀑布图

描述已自动生成

资料来源:中国信通院,Gartner,东兴证券研究所

        3)算力网络算力高效调度需要建立算力网络。算力基础设施从云向算泛在演进,其位置的分布从中心向边缘和端侧泛在延伸,将出现云、边、端三级算力架构。算力的分布将不再集中在数据中心,而是广泛地分布在边缘或者端侧的任何位置。其中,(1)中心指云计算的数据中心。(2)边缘指多接入边缘计算。物联终端设备产生的数据不需要再传送至遥远的云数据中心处理,而是就近在网络边缘侧完成数据分析和处理,更加高效和安全。(3)端侧指终端,即 PC、手机、智慧电视,以及家庭的机顶盒、智能水电表等一切具备联网和计算能力的设备。物联网时代,将会有海量终端接入到网络中,汇集闲散设备的存量算力,实现算力共享。

        4)算力租赁算力租赁是一种通过云计算服务提供商租用计算资源的模式,适用于各种大规模计算需求的场景,企业用户可以根据自己的需求租赁服务器或虚拟机实现大规模的计算任务,而无需拥有自己的计算资源。对上游算力生产商而言,在算力硬件进入淡季、库存趋增时,能通过售卖云算力的方式,平滑收入的波动,并为旺季储备“有生”力量,及时满足回弹的市场需求;对中游云服务厂商而言,则有助于增加客流;对下游算力需求方而言,能最大化降低使用算力的门槛,驱动全民 AIGC 时代降临。据产业调研了解,目前 AI 算力租赁尚处于试水阶段,主要模式为:1)算力买断:面向体量稍大且训练需求频繁的客户,往往采用买断独占模式,即 GPU 只提供给特定客户使用,往往需签订长约。2)算力零售:面对中小客户,签约时间较短,中间会有空档期,但价格随行就市。若未来 GPU 价格持续走高,该部分租金价格也会走高。

        需求侧,AIGC 大模型所需算力狂飙,AI 算力租赁市场潜力巨大。。根据 OpenAI 测算,自 2012年至 2018 年,用于训练 AI 所需要的算力大约每隔 3-4 个月翻倍,总共增长了 30 万倍(而摩尔定律在相同时间只有 7 倍的增长),每年头部训练模型所需算力增长幅度高达 10 倍,整体呈现指数级上涨。

(三)、下游:

        互联网、制造、金融为当前算力水平较高的行业。根据清华产研院的报告,统计范围内的行业在 2022-2023 年相较前一年有较明显的计算力水平提升。制造行业算力水平由原来的第三位上升至第二位,政府、教育、医疗行业的算力水平增长较明显。

行业算力水平

图表, 条形图

描述已自动生成

资料来源:清华大学产业研究院,方正证券研究所

 

行业现状:

        算力规模不断提升,产业体系逐步完善:根据《2023 智能算力发展白皮书》显示。截至 2022 年底,全球算力总规模达到 650EFLOPS,其中,通用算力规模为 498EFLOPS,智能算力规模为 142EFLOPS,超算算力规模为 10EFLOPS。智能算力规模同比增加了 25.7%,占比达 21.9%。我国算力规模方面,截至 2022 年底,中国算力总规模为180EFLOPS,排名位居全球第二。其中,通用算力规模为 137EFLOPS,智能算力规模为 41EFLOPS,超算算力规模为 2EFLOPS。

近两年全球算力情况 近两年我国算力情况

图表, 条形图

描述已自动生成

资料来源:《2023智能算力发展白皮书》,首创证券

        在数据存储力方面,我国存储规模不断扩大,截至 2022 年底,我国存储总量达到 1000EB,较 21 年增 25%,以全闪存技术为代表的先进存力快速发展。

        在网络运载力方面,我国网络基础设施建设不断完善。截至 2023 年 6月,我国累计建成 5G 基站超过293 万个,光缆线路总长度达到 6196 万公里。

从硬件设备角度,根据信通院测算,2022 年我国计算设备算力总规模达到 302EFlops,全球占比约为33%,连续两年增速超过 50%。

        从数据资源角度,数据要素是数字经济时代的新型生产资料,也是支撑算力产业发展的核心资源。近年来,我国数据资源供给能力不断提升。2022 年,我国数据产量达到 8.1ZB,同比增长 22.7%,全球占比10.5%,位列全球第二。

        同时,我国数据要素监管体系不断完善、数据资源流动体系加速建设。截至2022 年底,我国已经 208 个地方政府上线数据开放平台,全国成立 48 家数据交易机构,北京、上海、深圳等地加速探索数据流通和利用模式。随着东数西算工程的持续推进,算力网络投入持续增大,算力产业在规模逐步提升的同时,低碳高质、协同发展的格局正在逐步形成。根据工信部数据,2022 年我国算力核心产业规模已经达到 1.8 万亿元,而更广义的以计算机为代表的计算产业规模达 2.6 万亿元,产业高质量发展新格局正在形成。

 

大陆相关企业:

浪潮信息:

浪潮信息是国内领先的服务器制造企业,专注于为客户提供先进的云计算、大数据、边缘计算等计算产品和解决方案。算力方面,公司服务器产品体系丰富,竞争优势明显。公司通过场景优化设计,形成了一系列丰富的产品线,涵盖了计算型、存储型、多节点、关键应用、整机柜等各类服务器,支持全场景高效计算。2022 年,公司人工智能服务器市占率连续 3 年全球第一,连续 6 年市占率中国第一;2023 年 Q3 浪潮信息居全球服务器份额第二。公司牵头参与服务器全部国标,是唯一一家同时加入全球三大开放计算组织的服务器供应商。公司是百度、阿里、腾讯等大型企业最主要的 AI 服务器供应商,与科大讯飞保持在系统与应用的深入合作,帮助 AI 客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。公司打造最广泛、多元的算力平台,推出全新一代 G7 服务器,是目前业界算力支持最广泛的平台。公司在 AI 服务器领域具有先发优势,全栈布局液冷。多年来围绕智慧计算、数据中心液冷技术持续加大研发投入,目前全系列服务器均支持冷板式液冷,实现全算力业务场景覆盖。

 

中科曙光:

中科曙光是国内领先的高端服务器生产商。公司高端服务器产品全栈自研,拥有大规模部署实践;不断开拓算力服务业务,通过全国一体化算力服务平台加速海量复杂行业应用创新与落地,为国内多个大模型提供算力支持。公司高端计算机产品包括机架式服务器、高密度服务器、刀片服务器、超融合一体机产品等,能面向多种应用场景,兼顾性能、能效、应用生态,具有领先的计算密度和节能性。公司的高端服务器产品也涵盖浸没液冷、冷板液冷等产品形态,具有节能高效、安全稳定、高度集成等特点。智能计算天阔服务器X785-G30:采用 Intel 最新一代的 Xeon Scalable 系列处理器,可支持更多 CPU 核心,最高支持DDR42933 内存,极大地提高了系统性能,处理器集成 6 通道内存控制器,支持最高 2933MHz 的DDR4 内存。单颗 CPU 最高可提供 28 核心计算能力,采用全新的 UPICPU 总线互联技术,总线频率高 10.4GT/s,计算能力大幅提升。曙光超融合整体解决方案采用微服务架构,将服务器资源统一整合。基于高效可靠的服务器实现一体化的系统交付。

 

神州数码:

神州数码是是国内 IT 分销领军厂商,具有领先的服务器生产制造优势及行业解决方案实践经验。公司拥有丰富的信创产品结构,为用户提供完善的算力形态。公司持续发力服务器自主研发,打造贯穿服务器、中间件、通用解决方案乃至全面算力平台的国产化产品,形成覆盖 ARM 服务器、网络、终端、一体机的产品体系,实现“核心技术自主创新、核心产品自主研发、核心业务自主可控”,为云计算、大数据服务能力提供算力支撑,加强多种算力的统一调度,提高算力基础设施的资源利用率。神州鲲泰系列服务器持续为各行业数字化转型提供坚实算力底座。基于华为鲲鹏+昇腾产业生态,神州数码信创业务打造神州鲲泰系列入门型、均衡型、高性能型、AI 计算型等多种类服务器。神州鲲泰KunTai R722 服务器算力表现卓越,可满足构建算力网络、算网基础设施建设、一体化算网融合等业务需求。鲲鹏 920+昇腾 910 处理器的神州鲲泰新一代中心训练服务器可广泛应用于深度学习、模型开发 AI 训练服务场景。

 

免责声明:本文章不涉及投资建议,仅供分享观点所用。

参考资料:

首创证券:计算机行业深度报告:AI 崛起,算力先行

毕马威:计算机行业:“普慧”算力开启新计算时代

中信证券:多模态推动技术迭代,国产化助力产业成长

东兴证券:供需向上,算力网络为云计算打开新模式

方正证券:计算机行业深度报告:算力服务,从“东数西算”到“东推西训”