IDC知识库
IDC领域专业知识百科平台

deepseek正式发布V3.1,同时上调API调用价格

8月21日,DeepSeek官方公众号公布,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。如果仅从命名来看,DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。

DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。

官方数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

通过Post-Training(后训练,大语言模型训练流程中的关键阶段)优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1相较以往模型进步明显。

社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了Anthropic的Claude 4 Opus等多个知名模型,且完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

随着V3.1发布,DeepSeek也同步调整了API接口调用价格,并取消夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。

值得注意的是,DeepSeek还在评论区中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

此前有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

域名频道为客户提供服务器代维服务,为客户节约服务器维护成本,费用不到专职人员的十分之一。
服务器托管与单独构建机房和租用专线上网相比、其整体运营成本有较大降低。
网站空间可随意增减空间大小,空间升级可以按照对应的产品号升级到相对应的空间类型。随时随地能达到用户的使用要求。
您有自己的独立服务器,需要托管到国内机房,我们为你提供了上海电信五星级骨干机房,具体请查看http://www.dns110.com/server/ai-server.asp

赞(0)
分享到: 更多 (0)

中国专业的网站域名及网站空间提供商

买域名买空间