智谱开放平台近日正式发布了GLM-5.1高速版APIGLM-5.1-highspeed,该版本在推理性能方面实现重大突破,模型输出速度高达每秒400 tokens,一举刷新了当前全球大语言模型API的速度上限,树立了行业新标杆。此次推出的 GLM-5.1-highspeed版本由智谱AI与高性能推理框架团队TileRT深度合作、联合研发,在确保模型保持强大语言理解和生成能力的同时,显著优化了推理延迟,首次在国产大模型产品中实现了旗舰级智能能力与极致低延迟响应的完美结合。这一技术突破特别适用于对响应速度要求极为严苛的应用场景,例如AI辅助编程、高频率人机实时交互、低延迟语音对话系统等,能够为用户提供流畅、即时的智能体验。目前,GLM-5.1高速版API已进入定向开放阶段,面向部分经过筛选的企业客户率先提供服务,后续将根据测试反馈逐步扩大开放范围。信息来源:智谱开放平台。
客服热线:










