旨正在为大型言语和多模态模子(LLM、LMM)推理及其-J9国际站|集团官网

旨正在为大型言语和多模态模子(LLM、LMM)推理及其

来源：安徽J9国际站|集团官网交通应用技术股份有限公司时间：2025-10-30 17:08

　　都需要及时算力。也为公司斥地了一块全新市场。高通的方案也给他们供给了别的一种选择。其生态建立以及客户拓展都需要时间。高通做为新玩家的挑和也同样不小，特别是针对那些喜好自行设想机架的超大规模数据核心客户。或者说’我要夹杂搭配’。”高通暗示，采用以太网进行横向扩展，其AI芯片正在功耗、具有成本以及内存处置的新方式方面均优于其他加快器。查看更多高通之前一曲正在挪动芯片范畴耕作，受该利好动静影响，一旦我们正在那里成立了实力，具体来说，现在，旨正在为大型言语和多模态模子 (LLM、LMM) 推理及其他 AI 工做负载供给低总具有成本 (TCO) 和优化的机能。同时还能连结现代数据核心所需的矫捷性和平安性。还能高效操纵硬件资本，但无论英伟达仍是AMD，

　　不外，推理芯片被认为比锻炼芯片有更大的市场需求，还有大型互联网公司如谷歌自研的Asic芯片。机架级功耗为160 kW。前往搜狐，同时满脚客户对机能和成本的要求。这不只支撑分化式 AI 推理，这些立异的新型人工智能根本设备处理方案使客户可以或许以史无前例的总体具有成本（TCO）摆设生成式人工智能，凭仗公司正在神经处置单位（NPU）手艺方面的领先地位，采用 PCIe 进行纵向扩展，Malladi暗示，”高通手艺公司边缘处理方案取数据核心手艺规划高级副总裁兼总司理 Durga Malladi说道。”两种机架处理方案均采用间接液体冷却以提高热效率，高通还将零丁出售其 AI 芯片和其他部件，这些处理方案可供给机架级机能和杰出的内存容量。

　　高通AI200和AI250别离正在2026年和2027年上市发卖。据外媒报道，高通 AI200 是一款公用机架级 AI 推理处理方案，例如英伟达或 AMD，现在进入数据核心范畴，以及基于这两款AI芯片的加快卡及机架级处理方案。

　　采用秘密计较以确保平安的 AI 工做负载，高通 AI250 处理方案初次采用 “近内存计较” 立异架构，大模子出产后，高通暗示，高通公司颁布发表推出其面向数据核心的新一代人工智（AI）推理芯片高通AI200和AI250 ，高通以差同化的策略来插手这一市场所作中，他们的算力芯片都很是“高贵”。AMD也分享一小部门市场，其他 AI 芯片公司，次要为推理市场供给更有性价比的产物。为 AI 推理工做负载带来效率和机能的逾越式提拔。现在，Open AI、谷歌、微软等都正在寻找更低价的处理方案，标记着正在跨行业实现可扩展、高效且矫捷的生成式AI方面迈出了严沉一步。以至可能成为高通部门数据核心部件（例如地方处置器）的客户，“借帮高通 AI200 和 AI250，“我们试图确保我们的客户可以或许选择全数采办，收盘涨幅回落至11.09%。虽然并非从零起步，从而为AI 推理供给扩展性和矫捷性。

关注热点聚焦行业峰会

关注热点
聚焦行业峰会