时间: 2025-01-28 13:11:22 | 作者: 冷库设备
所有人的目光聚焦在生成式AI时,Arm同样如此,还提出了很具体的目标。
一年一度的 Arm Tech Symposia 年度技术大会深圳站,Arm 终端事业部产品管理副总裁 James McNiven表示,“预计到2025年底,全球将有超过1000亿台Arm设备具备 AI 能力。”
对于Arm架构芯片出货量已超越3000亿颗的Arm来说,这是一个可以轻松达成的目标吗?
“我不会说这是一个很轻松就能达成的目标。”James McNiven对雷峰网表示,“我们与生态合作伙伴一起能够达成这个目标。”
为了达成这个目标,Arm有一些列动作,包括为生成式AI计算进行的持续的架构演进,提供易于使用的软件工具,以及特定面向行业的整体解决方案,还有更广泛的合作。
比如2011年Armv7-A中引入了Neon,Neon是高级单指令多数据(SIMD)指令的一种实现方案。
2021年Armv9-A中引入了SME和SME2。SME引入了两个关键的新架构特性:Streaming SVE模式和ZA存储,新特性使SME 和 SME2 能够高效地处理矩阵和基于向量的工作负载。
联发科最新的旗舰芯片天玑9400,就是借助SVE2让联发科的芯片协助开发者和终端提升视频和图像处理,提供更好的照片质量,并为用户在观看流媒体视频和浏览社会化媒体应用程序时提供了更好的续航能力。
SME建立在SVE2的基础之上,新增了高效处理矩阵的能力,是一个增强矩阵操作的架构扩展。
Arm SME能够明显提升Arm CPU上处理现有AI和ML应用的能力,加速很多利用矩阵运算的应用,例如 AR、VR 和图像处理。
这也意味着,从2015年使用Armv8(NEON)架构的Cortex-A73 CPU开始,Arm在AI领域的投入就已经转化为产品。Arm将实现的1000亿台设备具备AI能力的目标,也覆盖从Armv8(NEON)到Armv9(SVE2/SME)的所有产品。
可扩展的计算平台只是Arm满足生成式AI时代需求的技术底层。对于芯片设计企业来说,关注可扩展能力的同时,也关注性能和产品上市时间。
芯片行业不变的追求就是以更小芯片面积和更低功耗实现更高性能,性能总是会成为首先被关注的焦点。
Arm Cortex-X925显著的性能提升得益于L2缓存从2MB增加到3MB,增强了整体性能和能效。再结合Cortex-X925 在更快速、更高效预取数据和复杂指令的能力后,效果更佳明显。
除此之外,Cortex-X925也充分的利用3纳米工艺的优势,在需要时以更高的频率运行 CPU,来提升响应速度、应用启动速度和浏览器性能并且保持能效优势。
Cortex-X925中矢量管线 TOPS 提升,可加快智能手机上的AI应用响应速度。
即便Arm的设计足够优秀,想要加速产品上市进程,还需要整体解决方案。为此,Arm推出了Arm 终端计算子系统 (CSS),CSS具备最新的 Armv9 CPU、Arm Immortalis GPU、基于3纳米工艺生产就绪的CPU和GPU物理实现,以及最新的 CoreLink系统互连和系统内存管理单元 (SMMU)。
Arm终端CSS提升了30% 以上的计算和图形性能,AI推理速度也提高了59%,以应对各种严苛的工作负载,适用于广泛的AI应用。
“Arm终端CSS的重点是Arm目前性能最强、效率最高、功能最广泛的CPU集群,带来最佳的性能和能效。”James表示。
“开发者需要统一的开发平台,换言之,我们要让开发者不需要关心底层硬件,让他们完成一次代码编写后就可以部署到不同的解决方案中。”James 同时表示,“基于Arm平台超过2000万的开发者对于软件平台也有易于使用的要求。”
面向生成式AI的时代,Arm推出面向热门AI框架的Arm Kleidi软件库。
KleidiAI的命名来自于希腊语“kleidi”,意为“钥匙”,象征其在提升Arm CPU上AI性能方面发挥着关键作用。
Kleidi 软件库包含面向AI工作负载的KleidiAI,和面向计算机视觉工作负载的 KleidiCV。
Arm近日也宣布成功将Arm KleidiAI软件库集成到腾讯混元自研的Angel机器学习框架,能够持续为跨操作系统的不同基于 Arm 的设备带来显著的性能提升。
Arm的工程团队只用不到24小时就测出了Llama 3的优化性能,充足表现了KleidiAI易于集成的特性。
软件库中的KleidiCV,能够加速许多摄像头用例中的计算机视觉管线。基于KleidiCV集成,全球最的的计算机视觉库OpenCV发现各种图像处理任务的典型性能提升高达75%。
值得注意的是,Arm Kleidi 软件库适用于从终端到云端的各种应用场景。
“AI比历史上其他计算技术都更耗电和内存。”James表示,“先进封装作为解决AI计算挑战的新方法,我们要驱动基于Arm的小芯片生态的繁荣。”
这就离不开Arm全面设计 (Arm Total Design)生态的壮大,这个生态中除了Arm的软件和固件,还有先进的代工厂、芯片设计企业、EDA、内存、第三方IP等公司。
对于Arm,只有不断拓展自己的边界,成为平台公司,更加有助于加速实现明年底1000亿台Arm设备具备运行AI能力目标的实现,这也将帮助Arm在生成式AI时代保持领先优势。
今天一觉醒来,杭州市区雨雨雨,临安太子尖、清凉峰等高山上雪雪雪……到早上7点多,海拔1557米的太子尖上,积雪至少已经有七八公分厚了。这是2025年杭州的第一场雪吗?不是,此前太子尖上已经下过两次雪星子,稍纵即逝,落地即化。
国内某机场疑似有无人机“黑飞”,客机在空中盘旋十几圈才下降,导致机场大量延误。富阳人蒋正豪生于2002年,去年7月刚从温州理工大学毕业。
升学宝前晚,有网友称浙江大学玉泉校区东门的一棵大雪松正在被起重设备吊起。浙大更换“BG树” 图源:浙江大学CC98论坛昨天上午9点左右,原来的位置已经新种上了一棵直径20厘米的小雪松。浙江大学玉泉校区东门新种下的雪松原来的雪松为何需要更换?
近日,#霸王茶姬 外网#登上热搜,网友发现霸王茶姬在境外社交平台上发布的文案使用了Lunar New Year来指代春节,而不是Chinese New Year或Spring Festival。1月24日晚,霸王茶姬在微信公众号和微博评论区就“春节”一词翻译不当致歉。
最近几天,不少有春节出行计划的旅客发现,他们提前预订的机票又降价了,有的价格跳水近一半!有网友后悔到拍大腿,还有人“果断退掉,重新买”!暴跌近70%,杭州到三亚只要200多元以杭州出发的机票为例,春节假期期间,杭州到贵阳降价68%、到三亚降价61%、到海口降价54%。
从深圳徒步回衡阳过年的小伙到家了!15天650公里,花费4000多元!
历经15天,备受全网关注的“深漂阿辉”夏汪辉从深圳回到家乡衡阳,这个湖南小伙顺利完成了徒步650公里回家过年的承诺。夏汪辉的抖音账号截图。在开始这一次徒步以前,夏汪辉是一个普通的在深州打拼的90后湖南小伙,他给自己的抖音账号取名“深漂阿辉”。
近日,教育部办公厅印发《中小学科学教育工作指南》(以下简称《指南》)。
早从1月16日起,“春运大戏”就在沪昆高速提前开演,老司机在路上堵成了段子手。不少在路上的打工人扶额直呼“5小时纹丝不动,到家人都傻了”。虽然早已做好心理上的准备,但谁也没想到,今年回家的路竟依旧如此“坎坷”。到了20号,路面上依旧大红一片,后来者憋笑发问:16号那批到家了吗?