GGGuoshifu

站点公告

欢迎访问郭师傅的技术宅！分享技术干货与日常感悟，感谢你的到来～

了解更多

标签

1299 字

6 分钟

DeepSeek V4来了，聊聊我的第一手体验

2026-05-10

AI实践

AI

/

模型评测

DeepSeek在5月初正式发布了他们的第四代模型——DeepSeek V4。作为一个从V2时代就开始用DeepSeek的老用户，这次更新我自然没有错过。第一时间拿到API访问权限后，花了几天时间在实际工作场景中测试，这里记录一下我的真实感受。

一、模型基本信息#

DeepSeek V4这次带来了几个关键升级：

参数规模： 总参数量达到了一个新量级，但通过MoE架构控制了推理成本
上下文窗口： 标准支持128K上下文，最长可扩展到256K
多模态： 原生支持图像理解，不再需要单独的视觉模型
推理能力： 链式思维（Chain-of-Thought）能力进一步增强
代码能力： 代码生成和理解能力全面升级

二、实际体验#

2.1 代码能力#

这是我最关心的部分。在日常的开发场景中测试了几个典型任务：

代码生成

让它写一个SRS流媒体服务器的Docker Compose配置，包含RTMP推流和HLS拉流，输出质量很高，配置项考虑得很全面，甚至包括了健康检查和日志挂载。

代码审查

丢了一段有安全隐患的Node.js代码给它，V4不仅能指出XSS和SQL注入的风险，还给出了具体的修复方案和对应的npm包推荐。V3在这方面的表现就没这么完整。

Debug辅助

拿了一个真实的Nginx配置错误日志给它分析，V4直接定位到了upstream超时配置的问题，还顺带提到了HTTP/2连接复用可能带来的副作用。

2.2 推理能力#

推理是DeepSeek一直以来的强项，V4在这方面的提升比较明显：

数学推理的准确率有提升，尤其是多步计算和几何问题
逻辑推理的稳定性更好，不容易出现前后矛盾
链式思维的展示更清晰，中间步骤更容易理解

不过在一些特别复杂的推理场景下，偶尔还是会出现”想太多”的情况，把简单问题复杂化。

2.3 中文能力#

中文能力一直是国产模型的优势，V4在这方面继续保持：

中文写作流畅度很高，不会有翻译腔
对国内技术生态的理解比较准确
文言文、方言等特殊中文场景也有一定支持
诗词生成能力有明显提升（虽然这个场景不太实用）

2.4 长上下文#

128K的上下文窗口在实际使用中表现不错：

丢一整个项目的代码进去分析，能保持较好的理解
长文档的总结和提取比较准确
256K扩展模式下质量有一定下降，但可接受

三、和Claude的对比#

作为一个同时使用DeepSeek和Claude的用户，简单对比一下：

维度	DeepSeek V4	Claude Sonnet 4
代码生成	强	强
推理能力	很强	强
中文能力	很强	强
长上下文	强	很强
API价格	便宜	较贵
生态成熟度	一般	成熟
安全对齐	适中	严格

整体来看，V4在代码和推理方面已经和Claude处于同一梯队，中文场景甚至略有优势。但在生态成熟度和安全对齐方面，Claude还是领先不少。

四、API使用体验#

4.1 接入方式#

V4的API接入比较标准，兼容OpenAI的API格式：

1
from openai import OpenAI
2

3
client = OpenAI(
4
    api_key="your-deepseek-api-key",
5
    base_url="https://api.deepseek.com/v4"
6
)
7

8
response = client.chat.completions.create(
9
    model="deepseek-v4",
10
    messages=[
11
        {"role": "system", "content": "你是一个有帮助的助手"},
12
        {"role": "user", "content": "解释一下MoE架构的工作原理"}
13
    ],
14
    temperature=0.7,
15
    max_tokens=4096
16
)
17

18
print(response.choices[0].message.content)

4.2 响应速度#

V4的API响应速度整体不错：

首token延迟约200-500ms
生成速度大约50-80 tokens/s
长上下文场景下速度会有一定下降

4.3 价格#

DeepSeek的价格一直是其核心竞争力，V4继续保持：

输入：约0.5元/百万token
输出：约2元/百万token
相比Claude便宜了不少，适合大批量任务

五、不足之处#

说了这么多优点，也提几个不足：

function call还不够稳定： 偶尔会出现参数格式错误，需要做容错处理
安全边界有时过于宽松： 某些场景下会输出不太合适的内容
英文能力不如Claude： 纯英文场景下还是有差距
API稳定性有待提升： 高峰期偶尔会出现超时
文档质量一般： 很多细节需要自己摸索

六、总结#

DeepSeek V4是一次非常有诚意的升级。在代码和推理这两个核心能力上，V4已经达到了一线模型的水平，加上极具竞争力的价格，对于开发者来说是一个非常好的选择。

我的使用策略是：日常中文任务用DeepSeek V4，复杂推理和对安全性要求高的场景用Claude。两个模型各有优势，搭配使用效果最好。

期待DeepSeek后续能继续优化API稳定性和function call的可靠性，那就真的香了。

DeepSeek V4来了，聊聊我的第一手体验

https://www.mgstudio.icu/posts/deepseek-v4-model-review/

作者

GGGuoshifu

发布于

2026-05-10

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

Minecraft Java版终于官方支持好友联机了！快照版抢先体验

狐蒂云暴雷深度复盘：从“永久VPS”神话到一夜跑路，数万用户血本无归的真相

郭师傅 の 技术宅