【头条】芯原的GPGPU-AI秘制配方;

来源:爱集微 #汇总#
8103

1.关税威胁日益加剧,中国电动汽车制造商继续大举进军欧洲;

2.芯原的GPGPU-AI秘制配方;

3.黄仁勋五年内身价暴涨30倍至900亿美元,位列全球前20大富豪;

4.美光科技侵权案败诉,或向HBM专利持有者支付13亿美元赔偿金;

5.挥别三星 Google手机芯片转单台积电;

6.小摩警示缺水危机 AI数据中心2030年每日耗4.5亿加仑水;

7.英伟达被爆降价,业内人士:H20降价很正常;


1.关税威胁日益加剧,中国电动汽车制造商继续大举进军欧洲;

尽管政界人士提出了对世界第二大经济体的汽车征收高额关税的可能性,但中国的电动汽车制造商仍在向欧洲扩张。

近段时间,蔚来、小鹏汽车、比亚迪陆续在欧洲展示了其多款汽车。欧盟委员会(欧盟执行机构)正在调查中国向电动汽车制造商提供的补贴,而此次公开营销活动正值此之际。此次调查的结果可能会导致对中国电动汽车进口征收关税。

美国已经采取了这样的举措,拜登政府对中国电动汽车进口征收100%的关税。

中国电动汽车制造商一直在积极向海外扩张,希望挑战埃隆·马斯克的特斯拉在国际上的领先地位。比亚迪等公司对汽车的残酷定价表示担忧。比亚迪有一款名为海鸥的汽车,这是一款小型全电动掀背车,起价仅为 69,800元人民币,不到10,000美元。中国公司推出廉价汽车的能力可能会给老牌汽车制造商带来压力,它们可能无法与折扣价相媲美。

多年来,得益于中国政府的激励和支持,中国电动汽车行业蓬勃发展,这引起了欧洲和美国政界人士的担忧。

近日,媒体询问欧盟可能征收的关税时,法国财政部长布鲁诺·勒梅尔并未证实此类措施正在实施中。但他表示,他的目标是“保护我们的行业,并确保在国际舞台上有一个公平的竞争环境。”

然而,并非所有电动汽车厂商都欢迎关税,特斯拉的马斯克就表示他不赞成对中国电动汽车征收关税。马斯克周四在 VivaTech 大会表示:“特斯拉和我都没有要求征收这些关税。事实上,当美国的100%进口税宣布时我感到很惊讶。”。

今年早些时候,马斯克曾警告称,如果没有贸易壁垒,中国电动汽车企业将“击败”国外竞争对手。



2.芯原的GPGPU-AI秘制配方;

从单一的图形渲染工具,再到如今通用计算的澎湃核心,GPU已毫无悬念的成为近几年来半导体产业最火热的增量市场,也正是在这样的狂潮之下,英伟达才得以创造一个不可思议的商业神话。

过去3年,中国本土冒出的GPU企业中,几乎每一家都拿产品性能与英伟达的GPU公开比较,这种对比帮助中国公司在行业鼎盛时期吸引了大量资金的青睐,动辄数十亿。然而,在经过行业震荡和地缘政治因素夹击之后,现如今再评估中国公司的GPU产品时,各界的眼光与视角显得格外冷静,如场外资金一般克制。

抛开现象看本质,当海外先进制造工艺关闭了绿灯,本土GPU行业无法继续在产品层面展开讨巧的数据对比,这时就需要聚焦到技术本身的发展过程之中。但本土GPU公司大多成立不久,技术发展史也只能从团队成员的履历里管中窥豹,要观察完整的GPU技术发展过程,就不得不提到一家从来没有过“产品”的公司——芯原股份。

无形之刃,芯原GPU成色几何

芯原股份正式拥有自研的GPU核心技术是在2016年,依靠收购嵌入式GPU公司图芯(Vivante)才开始进军GPU研发领域。被收购的Vivante属于GPU领域的老牌劲旅,此桩收购案当时有两大看点,一是芯原股份创始人戴伟民与Vivante CEO 戴伟进之间的兄弟关系,二是Vivante深厚的GPU技术造诣对芯原IP版图如全球领先的视频处理器VPU和数字信号处理器ZSP的重要补强。

成立于2004年的Vivante,很早就奠定了嵌入式GPU行业的领先地位,尤其是在移动GPU领域。根据2012年JPR公布的移动GPU市场份额排名,Vivante排在Imagination和高通Adreno之后,位列第三;在GPU IP领域则更是仅次于Imagination,排在第二。

如今担任芯原GPU产品副总裁的张慧明,也曾是Vivante研发团队中的核心人员。在接受集微网专访时,张慧明介绍称,芯原的GPU IP研发团队经历了GPU产业完整的发展过程,从早期电脑中对图形显示的驱动、到个人电脑普及后对游戏画面的渲染、再到区块链时期和弱人工智能时期开始涉及一些通用的计算,最后到如今的生成式AI爆发期,芯原的GPU IP一直追逐最前沿的技术和市场,其GPU IP和GPGPU IP如今均已在业内获得了头部客户的广泛应用和关注。

图示:芯原GPU产品副总裁的张慧明

张慧明表示,芯原的GPU IP基于统一的架构,由固定的图形处理单元,GPGPU通用计算,以及针对AI加速的含Tensor Core在内的张量处理三大部分构成,可打造出支持异构计算的GPGPU-AI IP。

如果将三个部分组合在一起,这种解决方案就类似于英伟达的RTX 4090和3090这种带AI功能的显卡,满足类似AI PC等新的应用场景;如果将GPGPU和AI加速这两个部分组合在一起,就能组成算力卡;如果仅仅采用AI加速这部分,则是专用的AI处理器。

在保证通用性的基础上,芯原还对AI应用场景进行了针对性优化。在提供更密集的计算资源的同时,芯原GPGPU-AI IP提升了单核架构的算力,从一个并行处理单元扩展到8-10个并行处理单元,使得算力提升8-10倍。另外,芯原还研发了并行处理单元任务分发算法和控制器,以及高带宽二级及三级缓存,打造出可以用于服务器和数据中心的高性能GPGPU-AI处理器IP。

此外,张慧明还特地强调了芯原GPGPU-AI IP的可扩展能力,通过多核扩展、单核内多簇扩展和单核内多处理单元扩展的三级扩展模式,芯原能够满足不同客户的不同应用场景,为人工智能时代的AI芯片定制提供灵活的算力方案。

在芯原过去基于GPGPU-AI IP为客户打造的定制解决方案中,与之搭配需求最多的是视频处理器IP。张慧明指出,视频早已经成为一个重要的媒介。随着视频转码服务器、AI服务器、云桌面和云游戏等在内的下一代数据中心的需求不断提升,大算力服务器芯片普遍都需要具备一定的视频处理能力,且这种处理能力在性能、吞吐量、功耗和面积等方面,比过去专用视频编解码芯片的要求更高。其次,用于自然语言处理的NPU IP也是GPGPU-AI IP的另一个重要组合。

芯原拥有丰富的处理器IP,可以提供这些自研处理器IP定制化组合的完整解决方案。通过内部流水线级别的原生耦合,相比单独的各类IP拼接更具优势。张慧明强调,芯原的不同种处理器之间不仅能做到数据互通,还重点开发了独有的数据压缩技术,在每个IP之间都能通过压缩技术来减少带宽,从而在有限带宽上发挥出更大的算力。加上芯原创新的FLEXA低功耗低延迟同步接口通信技术,可极大程度地提升IP间的交互性能。

现状与出路

当下,AI时代加速到来催生了巨大的算力需求,我国GPU产业却因种种原因发展受限。在此背景下,用有限资源来跨越算力鸿沟是主旋律。

正如张慧明所言,芯原的带宽压缩技术便是其中的一种解决方案。在目前的工艺和技术限制下,国产芯片虽无法完全匹配国际领先的算力,但如果能在功耗层面明显大幅度降低,则能使产品同样具有竞争力。尤其在需要大量GPGPU做算力集群的场景下,如果能耗可以明显降低,既能为企业大幅节省成本,又符合全球绿色低碳的发展趋势。

另外,芯原近两年力推的Chiplet技术也是当前工艺受限的另一种解。用芯片做堆叠和集联,打造更大算力的单卡,替代过去低算力的多卡方案,进而获得更优秀的整体算力和功耗表现。

除了功耗和算力,软件生态也是国产GPU多年以来的发展痛点。在张慧明看来,本土生态近几年已经取得了长足的进步,尤其是一些大公司在生态上的投入和布局。随着生态短板被逐渐弥补,国产GPU与国际领先企业的正面比拼才刚刚开始。

在AI时代催生的GPU发展大潮中,谈及芯原的定位时,张慧明强调:“芯原一直秉持不做产品只提供IP授权和芯片定制服务的商业模式,以中立地位助力客户发展。基于GPGPU-AI、VPU、DSP以及NPU等一系列IP的参考设计,为客户提供全方位AI IP的平台方案和一站式AI芯片的定制服务。”

长远来看,大模型的发展会催生大量专用处理器需求,以提升整体计算能力,并降低整个算力集群的功耗,这便是芯原GPGPU-AI与其他多种处理器IP灵活组合定制的未来。(校对/Lau)



3.黄仁勋五年内身价暴涨30倍至900亿美元,位列全球前20大富豪;

5年前,英伟达CEO黄仁勋(Jensen Huang)持有该芯片制造商价值约30亿美元的股份。周五(24日)的上涨推动该股创下历史新高,目前他持有的股票价值已超过900亿美元。

英伟达周三(22日)盘后公布的第1季财报超出预期,在人工智能(AI)处理器需求的推动下,销售额连续第3季成长超过200%。

黄仁勋也发布了优于预期的财测,并向投资人表示,该公司认为其AIGPU仍有无法满足的需求,而且其客户、尤其是大型云端公司,可以从昂贵的芯片投资中获得丰厚的回报。

他说,“我们正在从根本上改变计算的工作方式和电脑的功能。”

黄仁勋拥有英伟达约8676万股股票,占该公司已发行股份的3.5%以上。随着该股周四(23)上涨超过9%,收于每股近1038美元,他所持有的股份价值单日增加约77亿美元。周五(24日),英伟达股价再上涨2.57%,也促使黄仁勋持有的股份价值进一步增加。

数据显示,英伟达股价在2023年翻了三倍,今年已经上涨1倍多。黄仁勋在2022年增持股份,当时该股在AI风潮前跌至相对低点。

61岁的黄仁勋于1993年创立了英伟达,致力于打造3D游戏的GPU。虽然游戏是该公司几十年来最大的业务,但其已经涉足其他市场,包括云端游戏订阅、虚拟宇宙和加密货币挖矿芯片。

但在2022年底,英伟达的命运发生巨大转变,当时OpenAI发布了聊天机器人ChatGPT,向广泛大众开放了生成式AI的概念。OpenAI的大部分AI开发都是在英伟达的GPU上进行。同时,微软、谷歌和Meta等其他科技公司也不断加大对AI研发的投资,并购买了大量的英伟达AI芯片。

十多年来,英伟达一直致力于开发AI软件和工具,最终成为全球多家大型科技公司的顶级供应商。该公司目前占有AI芯片约80%的市场,而黄仁勋则成为全球前20大富人之一。



4.美光科技侵权案败诉,或向HBM专利持有者支付13亿美元赔偿金;

美光科技公司因故意侵犯内存子系统供应商Netlist公司的专利而可能面临三倍赔偿。

据报道,Netlist设计并向企业客户销售固态硬盘和模块化内存子系统。该公司还声称拥有适用于高带宽内存(HBM)和DDR5的专利,这两种内存都用于数据中心的AI服务器群。

5月23日,美国德克萨斯州东区地方法院的陪审员裁定,美光的部分半导体内存产品侵犯了 Netlist的两项专利,这些专利与提高内存模块性能的技术有关。赔偿金额定为4.45亿美元,但陪审员还裁定美光故意侵犯专利,这可能导致法官将赔偿金额增加三倍。

该裁决涉及两项Netlist专利:美国专利号7,619,912和11,093,417。侵权产品均为美光DDR4 RDIMM和DDR4 LRDIMM。美光可能会对裁决提出上诉,并可能就专利有效性展开旷日持久的法律争论。

Netlist在一份声明中表示,陪审团判给的赔偿金额涵盖美光在2021年4月至2024年5月期间对其'912专利的侵权行为,以及在2021年8月至2024年5月期间对其'417专利的侵权行为。

值得一提的是,在对美光科技做出裁决之前,Netlist于2023年8月赢得了对三星的最终判决。在该案中,同样在美国德克萨斯州东区地方法院审理,首席法官Rodney Gilstrap裁定三星败诉,确认其存在故意侵权行为,并判决三星支付3.03亿美元的赔偿金。


5.挥别三星 Google手机芯片转单台积电;

美国科技媒体Android Authority报导,Google手机芯片代工策略转向,由三星转投台积电(2330)怀抱。Google预计明年用于Pixel 10系列手机的Tensor G5芯片,将改由台积电生产。

此前,本报曾于去年9月披露Google手机芯片代工将“弃三星,转台积电”的消息,如今外媒持续追踪并印证相关讯息。

即便Google手机销售量不多,业界人士分析,Google相关策略转向,象征台积电技高一筹,让Google转投入台积电怀抱,未来双方合作可望更紧密。

Google自研的Tensor处理器,从2021年的第一代产品以来,都与三星芯片部门密切合作,包括Pixel 9搭载的Tensor G4。

Tensor处理器在多数情况下都表现不错,但散热和效率却受影响,因三星的晶圆代工近来都无法匹敌台积电。

市场近来已盛传Tensor G5将由台积电代工,成为首款非三星代工的Google手机芯片。

Android Authority则根据公开贸易资料表示,能证实这则传言的真实性。经济日报



6.小摩警示缺水危机 AI数据中心2030年每日耗4.5亿加仑水;

人工智能 (AI) 在处理大量资料时,其实相当耗能,供电已是未来左右 AI 发展的重要关键之一,不过,摩根大通发布研究报告指出,AI 数据中心巨量水消耗问题相对被忽视,2030 年每天用水量可能达到 4.5 亿加仑。

AI 狂潮仍在持续,供应链的需求已经引发投资热潮,分析师 William Yang 及其团队撰写的摩根大通发布《深入探讨电力、冷却、电网和 ESG 影响》研究中,详细阐述基础设施对 AI 发展的影响。

文中专门介绍了 AI 数据中心对电力的消耗,值得注意的是,摩根大通的研发在报告结尾部分强调:“尽管数据中心因大量的电力消耗而容易重点关注,但相对而言,数据中心的高耗水基本上被忽视了,而这也是数据中心运作的基本特质。”

摩根大通引用 Bluefield Research 的数据在研报中指出,从 2017 年到 2022 年,全球数据中心的总耗水量 (包括现场冷却和非现场发电) 每年成长 6%。

研发说,到 2030 年,用水量可能会跃升至每天 4.5 亿加仑。这就相当于,每天大约需要 681 个奥运标准的游泳池的淡水,来冷却全球数据中心。

研报介绍,数据中心的用水方式与碳排放类似,数据中心的用水也可以分为范围 1、范围 2 和范围 3。在这种情况下,范围 1 指的是用于现场伺服器冷却的水,范围 2 指的是用于发电的场外用水。范围 3 被认为是伺服器制造供应链用水。

具体而言,范围 2 的用水是数据中心与发电相关的间接用水。传统的热电厂 (如燃煤电厂、天然气电厂等) 加热水以产生蒸汽,蒸汽用于旋转涡轮发电。水也用于冷却水塔中的散热。当使用热电时,数据中心的范围 2 用水足迹可能远大于范围 1。

Yang 表示,水资源稀缺地区的数据中心对水的巨大需求可能会引发“竞争加剧,导致水资源供应紧张,甚至导致数据中心关闭”。钜亨网



7.英伟达被爆降价,业内人士:H20降价很正常;

近日,英伟达「中国特供版」H20芯片被爆降价。据报导,一位芯片业界人士对此表示:「H20是为了替代英伟达H100芯片的产品,现在H100芯片也不缺,H20供应充足。由于市场需求回归理性,H100 开始降价,H20的价格出现下调也很正常。」

由于H20的技术受限,难以拉开与中国竞争对手的差距,因此需求受到一定制约。消息人士说,一开始H20的销售并不顺畅,主要原因是一些中国客户认为这款产品「不够高端」。

另据报导,据内部人士说:「英伟达H20芯片在国内是可以普遍买到的,但是它不再是以卡的形式,而是整机。一般都是英伟达把H20卖给服务器厂商,厂商组装成服务器之后,再卖给企业。」

H20是去年英伟达针对中国市场推出的一款旗舰芯片。英伟达执行长黄仁勋曾表示,这款芯片符合美国出口管制的要求。

分析师认为,H20 的表现将是影响英伟达中国业务的重要因素之一,而其长期前景取决于英伟达在中国的竞争态势。


责编: 爱集微
来源:爱集微 #汇总#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...