
深度求索官方今日(8 月 21 日)正式对外发布 DeepSeek-V3.1。本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
更强的 Agent 能力:通过 Post-Training 优化星星配资,新模型在工具使用与智能体任务中的表现有较大提升。
官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API 也已同步升级,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式,且上下文均已扩展为 128K。同时,API Beta 接口支持了 strict 模式的 Function Calling,以确保输出的 Function 满足 schema 定义。
另外,深度求索增加了对 Anthropic API 格式的支持,让用户可以将 DeepSeek-V3.1 的能力接入 Claude Code 框架。
关于 DeepSeek-V3.1 工具调用 / 智能体支持增强、思考效率提升、价格调整等具体情况,IT之家 App 进行了详细报道,感兴趣的朋友可以点击下方小程序卡片查看:
值得一提的是,在官方公众号文章页面,DeepSeek 进一步解释称,UE8M0 FP8 是针对即将发布的下一代国产芯片设计。
IT之家注:FP 英文全称为 Floating Point星星配资,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。
顺阳网配资提示:文章来自网络,不代表本站观点。