没等到R2,DeepSeek V3.1抢先登场:性能提升,API调用价格迎来调整
- +1 你赞过了
据DeepSeek官方消息,8月21日下午,DeepSeek宣布推出其最新的大语言模型DeepSeek-V3.1,同步完成官方App、网页端及API接口的全面更新。
据悉,本次升级包含三大主要变化:一是混合推理架构:一个模型同时支持思考模式与非思考模式;二是更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;三是更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
此外,为方便开发者接入,DeepSeek-V3.1同步升级API功能,新增Anthropic API格式支持,兼容Claude Code框架以降低迁移成本,同时推出严格模式Function Calling(strict)确保输出符合预定义schema,提升调用稳定性,并将上下文窗口扩展至128K tokens以满足文档处理、数据分析等需求。
开源方面,V3.1的Base模型与后训练模型已在HuggingFace和魔搭平台开放下载,支持FP8参数精度,但需注意新版模型对分词器及Chat模板进行了优化,与V3存在差异,建议参考官方文档进行部署。
值得注意的是,DeepSeek宣布将于2025年9月6日起调整API调用价格,取消夜间时段优惠并推出新版定价表,但在该日期前所有服务仍按原价格计费,用户可继续享受当前优惠。为应对需求增长,API服务资源已进一步扩容,开发者可提前测试性能。
如今,在大模型竞争日益激烈的背景下,DeepSeek通过V3.1的混合架构与Agent强化,展现了其在效率与实用性间的平衡能力。随着开源生态的完善和API兼容性的提升,该模型有望在企业和开发者社区中快速落地。
最新资讯
热门视频
新品评测
X
微博认证登录
QQ账号登录
微信账号登录