AI 时代,GPU 成主流,英伟达赚翻,炒作逻辑解析
AI时代,视觉计算成为主流,图形处理又一次将GPU推上顶峰。GPU是2T(to Things)的主要算力载体,在自主可控算力设计上GPU占据着核心地位,大家都在抢购GPU,NVIDIA英伟达也因此赚得盆满钵满。在AI芯片领域(包括训练和推理),市场份额超过80%。每次人工智能有技术突破,软件应用炒作的思路都是先炒作,但热度冷却后,硬件设备方向又被炒作起来,各种AI分支概念穿插其间。无论是去年chatGPT的诞生,还是今年SORA(文盛视频)的技术突破,同样的炒作逻辑都适用于软件应用:chatGPT、AIGC、AI多模态、游戏、文化媒体、SORA、AI教育、AI医疗、智能驾驶。 各方面的应用理念,硬件设备端为:先进制程制造、共封装光学元件(CPO)->以chiplet为代表的2.5D/3D封装、HBM内存芯片->AI芯片->GPU->板卡组装->交换机->光模组->液冷->AI服务器->IDC租赁及运营、AI机器人等。
1. GPU 的定义及其在 AI 发展中的重要性
GPU是专用于图形处理的硬件设备,最初用于游戏、电影等图形密集型应用。GPU的基本原理是通过并行处理大量计算任务来提高计算速度和效率。与CPU不同,GPU可以同时处理数百个线程,每个线程可以执行不同的计算任务,因此GPU可以在短时间内完成大量计算任务。GPU对AI发展的重要性如下:[1]并行计算能力:AI计算通常涉及大量并行计算来处理海量数据。GPU专为大规模并行计算而设计,拥有数千个处理核心,在相同时间内可以完成比CPU更多的任务。[2]提高计算速度和效率:GPU可以通过并行处理大量计算任务,显著提高AI算法的训练和推理速度。例如,深度学习模型中的矩阵运算可以在GPU上快速完成,从而加速[3]节省时间和成本:在传统CPU上训练深度学习模型可能需要数周甚至数月,但在GPU上可以在数小时或数天内完成。 节省时间,降低训练和推理的成本。[4] 支持深度学习算法:深度学习算法需要大量的计算资源,而GPU可以提供这些资源。例如,谷歌的TPU(Tensor Processing Unit)是专门为深度学习设计的硬件设备,其基本原理与GPU类似,但提供更高效的计算性能。[5] 更大的存储空间,推动AI技术的发展:GPU的广泛使用推动了AI技术的发展,通过GPU的高速计算能力,开发者可以更快地训练模型、测试算法,从而推动AI领域新算法和模型的研发。GPU还可以在云端运行这些机器学习训练模型进行分类和预测,可以支持比以前大得多的数据量和吞吐量,同时消耗更少的电量,占用更少的基础设施。专用于图形处理和计算的硬件设备在人工智能的发展中发挥着重要作用。GPU具有高速计算、节省时间和成本、支持深度学习算法等特点,在人工智能领域不可或缺。 未来随着GPU技术的不断发展,其计算速度、智能化、节能化、普及化都将不断提升,为人工智能技术的发展带来更多的可能性。
2、A股GPU计算芯片相关概念股:
国产GPU不断进步缩小与行业领头羊的差距。GPU主要有两条发展路径:传统2D/3D图形渲染GPU和专注于高性能计算的GP GPU。近年来,国产GPU厂商在图形渲染方面取得了长足进步,在GPU和高性能计算GPGPU领域均已推出相对成熟的产品,性能不断追赶业界主流产品,并在特定领域达到业界一流水平。在生态方面,国内大部分厂商均兼容NVIDIA CUDA,融入大生态并实现客户端导入。
[1] 景嘉微(300474):景嘉微是国内GPU市场的主要参与者,也是中国唯一一家自主研发商用GPU的公司。公司已成功开发出JM5系列、JM7系列、JM9系列高性能GPU,最新的JM9系列两款图形处理芯片已完成阶段性测试并进入量产阶段,JM9系列芯片应用范围广泛,可满足个性化桌面办公、网络安全防护、轨道交通服务终端、多屏协同等需求,有望成功应用于党政军等部门的办公电脑。在上一代芯片研发的基础上,已启动下一代图形处理芯片的研发,景嘉微致力于将新一代图形处理芯片推向市场,公司产品涵盖集成电路设计、小型雷达系统、无线通信系统、电磁频谱应用系统等,广泛应用于航空、航天、航海、车载等专业领域。
[2] 海光信息科技(688041):海光信息科技主要从事高端处理器、加速器等计算芯片产品及系统的研发、设计和销售,公司产品包括海光通用处理器(CPU)和海光协处理器(DCU),拥有成熟丰富的应用生态,内置专用安全硬件,可满足互联网、金融、能源等行业的广泛应用需求。公司的DCU系列产品海光8100采用先进的FinFET工艺,基于GPGPU架构,兼容通用的“CUDA-like”环境和国际主流商用计算软件、人工智能软件,可充分挖掘应用程序的并行性,发挥其大规模并行计算能力。
【3】龙芯技术(688047):龙芯技术坚持核心IP自主研发,已形成包括系列化CPU IP核、GPU IP核、内存控制器及PHY、高速总线控制器及PHY等数百个IP核。与国内大部分CPU公司以ARM或X86指令体系为主、融入国外现有信息技术体系不同,龙芯技术推出了自己的指令体系LoongArch,并基于LoongArch移植或开发了操作系统核心模块,包括内核、三大编译器、基础操作系统等,面向服务器、桌面和工控应用。与国内大部分CPU设计公司依靠先进技术提升性能不同,龙芯技术通过设计优化、先进工艺提升性能,摆脱了对最先进工艺的依赖,通过自主设计IP核,克服了国产工艺IP核不足的短板。
[4] 寒武纪(688256):2022年3月21日,公司正式发布全新训练加速卡MLU370-X8,搭载双芯片四核思元370,集成寒武纪MLU-Link™多核互联技术,在业界广泛应用于YOLOv3、Transformer等训练任务。MLU 370-S4、MLU370-X4、MLU370-X均基于思元370智能芯片的技术,通过chiplet技术的灵活组合,产品特性可满足更多市场需求。公司主要提供云端智能芯片及加速卡、训练机、边缘智能芯片及加速卡、终端智能处理器IP及配套基础软件开发平台,其产品广泛应用于消费电子、数据中心、云计算等诸多场景。
[5] 曙光股份(603019):公司背靠中科院国家级资源,聚焦高端计算机与信息系统领域,形成了围绕高端计算机的高性能计算机、通用服务器、存储产品、软件服务以及系统集成与技术服务四大业务,全面覆盖客户信息系统建设需求,相关产品广泛应用于政府、能源、互联网、教育、国防等领域。在高性能计算机方面,拥有业界最齐全的高性能计算机产品线,拥有支持GPU异构云计算技术的TC3600/TC4600集群架构和曙光星云、TC2600集群架构曙光5000系列、支持GPU异构计算技术的GHPC1000、个人高性能计算机、刀片服务器等。
[6] 芯原科技(688521):公司可提供高清视频、物联网连接、数据中心等多种一站式芯片定制解决方案,拥有自主可控的图形处理器IP、神经网络处理器IP等,拥有1400个处理器IP和1400多个混合信号IP及射频IP,可从定义到测试封装快速打造半导体产品。业务范围涵盖消费电子、汽车电子、物联网等多种应用领域。根据2021年统计数据,芯原半导体IP销售收入位居中国大陆第二、全球第七,其中公司图形处理器IP位居全球前三。公司GPU IP已被众多主流及高端汽车品牌采用。 同时,基于公司约20年Vivante GPU研发经验,此次推出的Vivante 3D GPGPU IP还能为从低功耗嵌入式设备到高性能服务器提供算力,满足广泛的人工智能计算需求。
【7】通富微电子(002156):公司充分利用通富超微苏州、通富超微槟城两大高端CPU、GPU量产封测平台,积极承接国内外客户高端CPU、GPU的封装测试,公司封测业务包括CPU、GPU两大类,全球50%以上的前20大半导体公司及国内绝大多数知名集成电路设计公司已成为公司客户,公司全力支持国内客户发展。
[8] 卓一科技(002369):卓一科技2018年2月在投资者互动平台回复投资者提问时表示,公司于2017年初开始自主研发生产多卡GPU矿机,经过长时间的测试,目前已进入量产阶段,充分展现了公司的研发实力和市场前瞻性。
[9] 杭锦科技(000818):高性能图像处理器研发。长沙韶光与中船重工709所联合研发的高性能图像处理器于2018年2月成功流片,可实现3D图像处理,其性能指标在国内处于领先地位。公司自主研发的高性能GPU芯片预计2019年实现量产推广。2020年5月12日在互动平台表示:公司电子板块以芯片为核心产品,聚焦高端芯片和通信两大领域,涉及GPU/FPGA/存储芯片/总线接口芯片、北斗三号芯片(北斗产业)、通信射频三大产业。
[10] 全志科技(300458):公司在超高清视频编解码、高性能CPU/GPU多核集成、先进工艺高集成度、超低功耗等方面技术处于行业前列,是视频、移动互联网设备及智能电源管理市场的主流供应商之一。
[11] 昊力科技(002729):其子公司合肥曲速主营GPU芯片、ADAS视觉芯片研发及销售,合肥曲速正在研发的GPU芯片采用模块化设计,可根据市场需求通过减少核心数量进行定制组合成各类需求的产品。与国内同级别产品相比,具有更高的算力、性能和功耗优势;与国外同级别产品相比,具有更高的性价比。合肥曲速主营GPU芯片、ADAS视觉芯片研发及销售,目前相关芯片尚处于研发阶段。根据合肥曲速未来发展规划,未来仍需持续投入,资金投入金额较大,投入周期较长。ADAS视觉芯片主要应用于国家可信嵌入式,合肥曲速将与软件工程技术研究中心紧密合作,开发汽车级视觉芯片产品,主要应用于L3-L4高级别自动驾驶领域。 并且ADAS芯片还处于研发阶段。
[12] 奥比中光(688322):公司是国内较早开展3D视觉感知技术系统研发、自主开发系列深度引擎数字芯片及多款专用感光模拟芯片、实现3D视觉传感器产业化应用的公司,是市场上为数不多能够提供拥有自主知识产权核心3D视觉感知产品的公司,也是全球为数不多全面布局六大3D视觉感知技术的公司。为满足更广泛的市场需求,公司拥有结构光、iToF、双目、dToF、激光雷达、工业3D测量技术,并针对各类场景开发特定产品。截至目前,公司已自主研发并商业化结构光、双目、iToF技术。 截至报告期末,全球仅有少数几家公司掌握核心技术并实现百万级阵列3D视觉传感器量产,包括苹果、微软、索尼、英特尔、华为、三星、奥比中光等。
[13] 天爵科技(688003):公司深耕智能网联领域,逐步布局智能驾驶域控制器、车路协同解决方案、AI边缘计算平台等产品线。智能驾驶域控制器基于边缘计算芯片开发,应用于多家国内自动驾驶龙头企业的无人物流车、无人出租车、无人公交、无人工程车等车型;车路协同解决方案基于边缘计算MEC开发,提供多传感器融合感知全息路口解决方案,应用于多个国家级智能网联示范区。2021年,公司成为NVIDIA Jetson产品线解决方案金牌合作伙伴,基于NVIDIA嵌入式GPU打造AI边缘计算平台,深度应用于智能网联领域各类场景。
[14] 中国电子港(001287):公司是NVIDIA在中国的授权分销商之一,主要产品为图形处理器(GPU)。公司主营业务为电子元器件分销、设计链服务、供应链服务。深圳市中电港科技股份有限公司主要产品为处理器、存储器、射频及无线连接、模拟器件、分立器件、传感器件、可编程逻辑器件等。公司曾荣获行业权威媒体《国际电子商情》评选的“中国十大品牌分销商”;
【15】中科创达(300496):公司取得Jetson、DRIVE平台的驱动开发及画质调优(ISP Tuning)权利,成为国内首家获得NVIDIA画质调优授权的公司,可为NVIDIA生态圈提供平台支撑。公司为合作伙伴提供全面系统的技术培训和后续问题解决支持;公司拥有专门的NVIDIA实验室,以及基于DRIVE、Jetson两大平台的专业驱动、画质调优、画质测试(lQ test)团队,并在IoT领域积累了丰富的成功案例;
[16] 北京君正集成电路(300223):北京君正集成电路是国内GPU领域的龙头企业之一,在存储芯片、智能视频芯片、模拟及互联芯片等领域拥有领先的技术和市场地位。公司主营业务包括存储芯片、智能视频芯片、模拟及互联芯片等,产品销往国内外市场。北京君正集成电路作为GPU领域的绝对龙头,在GPU领域拥有较高的知名度和竞争力。
未上市的GPU技术公司有6家: ①摩尔线程:公司专注于设计高性能通用GPU芯片,是一家为图形计算和AI计算提供元计算平台的集成电路高科技公司。公司高管团队来自NVIDIA、AMD、ARM等知名芯片公司,拥有丰富的GPU研究经验,致力于创新面向元计算应用的新一代GPU,构建集视觉计算、3D图形计算、科学计算和人工智能计算为一体的综合计算平台,建立云原生的计算平台; ②比人科技:公司于2022年8月发布的通用GPU芯片BR100创下了全球通用GPU算力纪录,峰值算力是国际厂商在售旗舰产品的3倍以上,BR100率先采用Chiplet技术、新一代主机接口PCIe 5.0,并支持CXL互联协议,奠定了公司在国内厂商中的技术领先地位。 公司坚持自主研发,同步推出原创架构“碧丽人”和自研BIRENSUPA软件平台,实现BR100性能的大幅提升。 ③芯动科技:公司推出面向商用市场的Innosilicon风华系列GPU,该系列GPU性能强劲、跑分领先、功耗低、内置智能计算能力,全面支持国内外CPU/OS及生态系统,包括Linux、Windows和Android。
④上海兆芯:公司分拆GPU业务,成立格莱飞智能科技有限公司,目前公司已推出Arise-GT10C0芯片及格莱飞Arise-GT-10C0显卡,该芯片内置新一代完全自主研发的图形图像处理引擎,兼容麒麟KOS、同芯软件UOS、Windows等主流操作系统,可运行于X86、ARM、MIPS等主流硬件平台,支持多种图形图像API接口标准。 ⑤天数智芯:公司推出通用GPU推理产品“智开100”及其丰富的AI应用案例,智开100计算性能高、应用覆盖面广、使用成本低。 支持FP32、FP16、INT8多精度混合计算,可提供最高384TFlops@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,800GB/s的理论峰值带宽,以及多种视频规格的128通道并发解码能力。 ⑥沐曦公司:拥有完全自主开发的GPU IP、指令集和架构以及兼容主流GPU生态的完整软件栈(MXMACA),产品具有极高的能效比和通用性,目前已推出MXN系列GPU(曦思)、MXC系列GPU(曦云)用于AI推理,MXG系列GPU(曦彩)用于图形渲染,可满足数据中心对算力高能效比和高通用性的需求。
相关文章
猜你喜欢
-
咨询业面临的十大颠覆:效率革命、信息差崩塌与PPT民工失业
作者:本文的材料来自DeepSeek编写的CMKT Group聊天记录,一些细节是模糊的,这被认为是人类计算机协作的文章。 咨询行业面对 十大颠覆者 1。[效率革命...