GPU公司曦望(Sunrise)完成超 10 亿元融资,估值破百亿

中国 AI 推理 GPU 赛道再迎重磅融资。据凤凰网消息,国内 AI 推理 GPU 企业曦望(Sunrise) 完成新一轮超10 亿元人民币融资,估值突破100 亿元,成为中国纯推理 GPU 领域首家独角兽企业。

这是 2026 年 AI 需求向推理侧转移背景下,国内 GPU 行业最大单笔融资之一。曦望源自 AI 巨头商汤科技分拆,至今已完成7 轮融资,累计融资额约40 亿元

本轮资金将主要用于:

  • 下一代启望 S3(Qiwang S3) 推理 GPU 的量产与交付

  • 全栈软件生态建设

  • 后续 S4、S5 芯片的持续研发迭代

启望 S3:主打推理效率,采用 LPDDR6 架构

曦望于 2026 年 1 月正式发布旗舰推理 GPU 启望 S3,是国内首款采用 LPDDR6 显存、同时兼容 LPDDR5X的推理 GPU。

与高端训练 GPU 普遍采用 HBM 路线不同,该芯片专为智能体(Agent)推理场景量身设计,从 AI Core 架构到存储 I/O 系统进行全栈重构。

架构思路源于推理负载截然不同的存储需求:在主流高并发、长上下文云场景中,KV 缓存可占总内存的 80% 以上

S3 基于 LPDDR6 的设计:

  • 提供充足推理带宽

  • 提升存储容量

  • 功耗降低50%

    完美匹配推理场景大容量、低成本、低功耗的核心诉求。

算力层面

S3 解决了通用 GPU 算力利用率偏低的痛点:

  • 推理性能较上一代 S2 提升 5 倍

  • 目标将Token 成本降低 90%

    在大模型推理中,GEMM(通用矩阵乘法)与 Attention 操作占算力超 90%,S3 将核心算子利用率推至:

  • GEMM:约99%

  • Flash Attention:约98%

    大幅提升整体效率。

企业定位:All-in 推理,已实现数万片量产

曦望董事长徐冰表示,2026 年 AI 推理需求预计将达到训练需求的4–5 倍,过去半年推理算力租赁价格上涨近40%

公司已完成三代推理 GPU研发,实现数万片规模量产

作为国内首家纯推理 GPU 独角兽,曦望的崛起标志着中国 AI 芯片从 “训推一体” 向专业化推理芯片的关键转向。

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。