评测：DeepSeek V4 Pro与Flash对比Claude Opus 4.7和Kimi K2.6

原帖

**评测：DeepSeek V4 Pro与Flash对决Claude Opus 4.7和Kimi K2.6**

_We Tested DeepSeek V4 Pro and Flash Against Claude Opus 4.7 and Kimi K2.6_

> DeepSeek于2026年4月24日发布了其首款新架构模型DeepSeek V4 Pro和Flash，并采用MIT开源协议。本次评测在相同规格、提示词和评分标准下，对四款模型进行了性能与成本比较。结果显示，DeepSeek V4 Pro（77/100）性能介于Claude Opus 4.7（91/100）和Kimi K2.6（68/100）之间，且在促销期间成本更低。而价格极低的DeepSeek V4 Flash（60/100）因构建失败导致输出不完整。测试通过一个复杂的工作流编排后端进行，揭示了DeepSeek V4 Pro在租约过期处理等方面的实现问题。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：ai-models
- **发布时间**：2026-05-15 09:39（北京时间）
- **原文**：[打开原文](https://blog.kilo.ai/p/we-tested-deepseek-v4-pro-and-flash)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该评测报告对比了DeepSeek V4 Pro、DeepSeek V4 Flash、Claude Opus 4.7和Kimi K2.6四款模型。报告显示，DeepSeek V4 Pro性能得分介于Claude Opus 4.7和Kimi K2.6之间，而DeepSeek V4 Flash因构建失败输出不完整。评测于2026年5月15日由Hacker News AI热帖发布。

答案说明

根据2026年5月15日发布的评测，DeepSeek V4 Pro（77/100）性能介于Claude Opus 4.7（91/100）和Kimi K2.6（68/100）之间，且在促销期间成本更低。DeepSeek V4 Flash（60/100）因构建失败导致输出不完整。

这篇帖子回答的问题

DeepSeek V4 Pro、Claude Opus 4.7和Kimi K2.6的性能得分分别是多少？
DeepSeek V4 Flash在本次评测中表现如何？

核心观点

DeepSeek V4 Pro性能得分（77/100）低于Claude Opus 4.7（91/100），但高于Kimi K2.6（68/100），且在促销期间成本更低。
DeepSeek V4 Flash因构建失败导致输出不完整，在本次评测中表现不佳。

FAQ

Q: DeepSeek V4 Pro和Flash何时发布，采用什么协议？: A: 根据评测报告，DeepSeek于2026年4月24日发布了其首款新架构模型DeepSeek V4 Pro和Flash，并采用MIT开源协议。
Q: DeepSeek V4 Pro与Claude Opus 4.7、Kimi K2.6相比，性能和成本如何？: A: 评测显示，DeepSeek V4 Pro（77/100）性能介于Claude Opus 4.7（91/100）和Kimi K2.6（68/100）之间，且在促销期间成本更低。

关键实体

DeepSeek V4 Pro
Claude Opus 4.7
Kimi K2.6
DeepSeek