
当地时辰2月24日,好意思国东说念主工智能(AI)芯片初创公司SambaNova发布了其最新一代的AI芯片SN50,定位是最高效的智能体AI芯片,堪称性能比同类芯片快5倍,并可为企业提供数落至蓝本1/3的总体领有成本,为推广快速推明智商和将自主AI代理全面插足坐蓐奠定了广博的基础。SN50将于本年晚些时候运行向客户发货。
同期,SambaNova还告示告示已取得来悔改老投资者的率先3.5亿好意思元的投资。以及与英特尔的谐和,共同提供高性能、高性价比的AI推意会决决策。
此前,SambaNova 在 2025 年末创下了订单量和收入的新记载,这反应出行家金融作事、电信、动力和主权部署等畛域对可插足坐蓐的 AI 系统的需求正在加快增长。
一、SN50发布:性能是B200的5倍
SambaNova创立于2017年,主要联想和构建集成的软硬件处分决策,旨在从数据中心到旯旮运行AI应用和数据密集型应用。SambaNova的AI芯片基于可重构数据流架构(RDU),使应用大略驱动优化的硬件建立,软件不受固定硬件的适度。
天然GPU在AI模子测验方面发达出色,但这是一个缱绻量很大的功能;AI算计是一种数据流动和内存优化的挑战,需要不同的架构程序。
为了进行东说念主工智能推理,GPU必须对片外内存进行屡次冗余调用。每次内存调用齐会增多进度的延长和能量蓦然,这亦然GPU需要如斯多功耗的原因。
而RDU将给定AI模子的图映射到数据在处理器中挪动的最高效旅途。这种程序摒弃了对内存的冗余调用,从而大幅数落了延长和功耗。
SambaNova最新推出的第五代基于RDU架构的AI芯片——SN50和SambaRack SN50系统,堪称是专诚为处分“代理推理”挑战而联想的,这亦然其他平台所莫得的。
据先容,SN50 的单加快器缱绻智商是上一代居品的五倍,会聚带宽是上一代居品的四倍。它可通过每秒数TB的互连链路聚首多达256个加快器,从而缩小初次Token生成时辰并守旧更大的批处理畛域。最终,企业不错部署更大、更具高下文洽商性的AI模子,并领有更高的隐约量和响应速率,同期保握高性能,并将成本和延长适度在可控范围内。
该芯片不错提供:
即时 AI 体验:超低延长为语音助手等下一代企业应用设施提供及时响应。
无与伦比的畛域和并发性——以历久如一的高性能守旧数千个并发 AI 会话;
残害性的模子容量:三层内存架构可守旧 10T+ 参数模子和 10M+ 高下文长度,从而达成更深入的推理和更丰富的输出。
畛域化达成最高恶果:更高的硬件应用率数落了每个令牌的成本,从而提高了性能和投资报恩率;
更智能的内存,更智能的恶果:驻留多模子内存和代理缓存优化了三层架构,数落了企业级 AI 部署的基础设施成本。
什么是代理推理?
SambaNova以最近席卷建设界的开源的东说念主工智能代理OpenClaw为例讲解注解说念,这个开源的东说念主工智能代理大略将问题拆解成子任务,并通过天然谈话凯旋聚首咱们的应用和器用来完成这些子任务。
可是即使在今天,当用户使用 ChatGPT 或任何大型谈话模子(LLM)界面时,OpenClaw 也会创建简化版的代理轮回来处分用户的央求。问题在于它需要对LLM进行一系列单独调用。关于很多用例,比如编码,这会带来典型GPU建立不能袭取的延长,挫伤建设者的体验。
{jz:field.toptypename/}延长在GPU上只可稍稍改善。Anthropic最近为Opus 4.6引入了快速口头,速率进步了2.5倍,但这带来了6倍的严重代价。
此外,这种“快速口头”对付知足代理推理和这些AI代理提供近及时谜底的最低速率条款。如今通盘其他硬件处分决策濒临的挑战在于,达成这种速率对推理作事提供商来说成本过高或难以推广。
对代理来络续理的代币经济学
在此配景之下,SN50芯片应时而生。SambaNova称,SN50 RDU为AI推理责任负载提供了无与伦比的超低延长、高隐约量和高效功耗性能,从压根上重塑了Token(令牌)生成的经济性。
与Blackwell B200 GPU比较,SN50在代理推理方面达成了5倍的最高速率和率先3倍的隐约量,这少许在多种型号中得到了显耀体现,比如Meta的Llama 3.3 70B,这款开源型号即使在发布多年后仍被粗俗使用。
这一令东说念主印象深远的性能是在SambaRack SN50系统平均仅20千瓦功率下达成的,使机架大略在现存的风冷数据中心中运行。这种性能、恶果和可推广性的联接蜕变为总领有成本(TCO)上风,这在市集上关于运行gpt-oss等模子的推理作事提供商来说,省俭成本是B200 GPU的8倍。
“全新的 SambaNova SN50 RDU 改变了大畛域 AI 推理的代币经济模子。SambaNova 的这款芯片选择现存电源和风冷样式,开云体育同期达成了高性能和高隐约量,正在改变游戏规章,”分析公司 IDC 高性能缱绻商量副总裁 Peter Rutten 示意。
Cambium Capital归并创举东说念主兼不竭结伙东说念主Landon Downs示意:“东说念主工智能正在从软件畛域转向基础设施畛域。SN50的联想旨在知足施行宇宙的延长和经济性条款,这些条款将决定谁能告捷地大畛域部署智能体东说念主工智能。”
代理缓存
与SN40L RDU访佛,SN50 RDU选择分层内存架构,联接了大容量内存、高带宽内存(HBM)和超高速SRAM。这种层级结构使芯片大略承载最大的模子,同期并交运行多个模子。
存在于HBM和SRAM中的模子不错在毫秒内进行热插拔,这关于频频切换多个模子的代理责任负载来说至关进军。
此外,通过咱们的SN50,输入Token不错缓存到内存中,减少预填充处理时辰和央求的初次Token时辰(TTFT)。联接起来,SambaNova的内存架组成为代理的理念念缓存,大略更高效地处理任务。
下一代畛域化
SambaRack SN50 联接了 16 颗 SN50 芯片,使每台加快器提供五倍的缱绻智商和四倍的会聚带宽。
互联的SambaRacks可通过多TB每秒互连推广最多256个加快器,这减少了TTFT并守旧更大的批次畛域。因此,不错部署隐约量更高、响应更快的模子。
SN50大略守旧咫尺和将来的最大模子,大略运行多达10万亿个参数的单个模子,其畛域和高下文长度高达1000万个Token。
软银在日本的东说念主工智能数据中心部署了SN50
软银集团将成为首家在日本下一代东说念主工智能数据中心部署SN50的客户。这次部署将为亚太地区的主权国度和企业客户提供低延长推理作事,守旧对延长和隐约量条款极高的开源和私有前沿模子。
软银集团副总裁兼时候部数据平台政策部认真东说念主丹波博信示意:“借助SN50,咱们正在为日本构建一个东说念主工智能推理平台,大略以客户和谐和伙伴祈望的速率、弹性和自主性为他们提供作事。通过选择SN50行动表率,咱们大略按照我方的样式提供宇宙一流的东说念主工智能作事——领有最好GPU集群的性能,但经济效益和适度力却远胜于它们。”
SambaNova示意,SN50 的部署深化了 SambaNova 与软银集团的现存谐和关联。软银集团已在该地区部署了 SambaCloud,为建设者提供超高速推理作事。通过将其最新集群部署在 SN50 上,软银将 SambaNova 定位为其自主东说念主工智能运筹帷幄和将来大畛域智能体作事的推理主干。
二、SambaNova和英特尔运筹帷幄开展多年谐和
SambaNova 和英特尔已达成一项多年政策谐和运筹帷幄,旨在为行家东说念主工智能原生企业、模子提供商、大型企业和政府机构提供高性能、高性价比的东说念主工智能推意会决决策。这次谐和将为客户提供一种广博的替代决策,以取代以 GPU 为中心的处分决策,为率先的开源模子提供优化的性能,并达成可预测的隐约量和总体领有成本。
行动谐和的一部分,英特尔运筹帷幄对 SambaNova 进行政策投资,以加快推出基于英特尔时候的 AI 云平台。这次谐和瞻望将涵盖三个要津畛域:
AI云推广——SambaNova正在推广其垂直整合的AI云平台,该平台基于英特尔至强处理器构建,并针对大型谈话和多模态模子进行了优化。该平台将提供低延长、高隐约量的AI作事,并由参考架构、部署蓝图以及与系统集成商和软件供应商的谐和关联提供守旧。
集成东说念主工智能基础设施——将 SambaNova 的系统与英特尔的 CPU、加快器会通聚时候相联接,为推理、代码生成、多模态应用设施和代理责任流提供可推广的、可用于坐蓐的推明智商。
市集推行实践——通过英特尔的行家企业、云和谐和伙伴渠说念进行归并销售和归并营销,以加快东说念主工智能生态系统的普及。
SambaNova 和英特尔联袂谐和,旨在打造下一代异构 AI 数据中心——整合英特尔至强处理器、英特尔 GPU、英特尔会聚和存储以及 SambaNova 系统——以开释数十亿好意思元的推理市集机遇。
SambaNova归并创举东说念主兼首席实践官Rodrigo Liang示意:“东说念主工智能不再是构建最大模子的竞赛。凭借SN50以及咱们与英特尔的深度谐和,确切的竞争在于谁能用即时响应、永不卡顿的AI代理点亮通盘这个词数据中心,况兼成本大略将东说念主工智能从一项实验酿成云表最赢利的引擎。”
英特尔数据中心劳动部实践副总裁兼总司理凯沃尔克·凯奇奇安示意:“客户但愿取得更多选择,并找到更高效的AI推广样式。通过将英特尔在缱绻、会聚和内存畛域的率先地位与SambaNova的全栈AI系统和推理云平台相联接,咱们为寻求GPU替代决策以大畛域部署高等AI的企业提供了一个极具眩惑力的选择。”
三、Vista和Cambium领投,SambaNova取得3.5亿好意思元融资
SambaNova示意,本轮 E 轮融资逾额认购,由 Vista Equity Partners 和 Cambium Capital 领投,Intel Capital(英特尔成本)也积极参与。
本轮新投资者包括:Assam Ventures、Battery Ventures、Gulf Development Public Company Limited、Mayfield Capital、Saudi First Data、Seligman Ventures 以及 T. Rowe Price Associates, Inc. 提供商量作事的账户。参与本轮融资的现存投资者包括:A&E、8Square、Atlantic Bridge、BlackRock、GV、Nepenthe、Nuri Capital 和 Redline Capital。
“跟着智能体责任负载的推广,企业发现,针对测验优化的基础设施难以知足坐蓐环境的延长和成本条款,咱们很运道能在 SambaNova 发展的要津时间对其进行投资,”Vista Capital 结伙东说念主 Monti Saroya 示意。“SN50 专为智能体 AI 系统而联想,大略谐和多个模子并近乎及时地处理央求,其恶果远高于传统的以 GPU 为中心的系统。”
据了解,SambaNova该轮融资所得款项将用于扩大 SN50 的坐蓐畛域、推广 SambaCloud 以及深化企业软件集成。
裁剪:芯智讯-浪客剑