百度百舸面向 DeepSeek V3 系列模型 AE 分离框架的实战
百度百舸基于万卡级生产系统实战经验,面向 DeepSeek V3.2 在推理引擎层面做了深度优化
百度百舸新一代大规模分布式推理基础设施,以三大核心支柱破解大模型部署困局!
提升超长上下文本推理吞吐,百度百舸 ESS 技术报告新鲜奉上
开源 vLLM-Kunlun Plugin,快速适配新模型、跑出极致性能
唯有让超节点的部署和运行体验达到「和单机 8 卡机一样」高效、顺畅与稳定,才能尽早且持久兑现性能红利
一次快速响应的开源协作,让 DeepSeek-V3.2-Exp 性能满血回归
在 25 年 8 月百度百舸将 Token 双流核心代码正式贡献至 SGLang 开源社区。
百度智能云用户态网络协议栈 Polar 全景解读
AI 计算首席科学家王雁鹏与十字路口主播 Koji 杨远骋展开一场深度对谈