评测:DeepSeek V4 Pro与Flash对比Claude Opus 4.7和Kimi K2.6
原帖
**评测:DeepSeek V4 Pro与Flash对决Claude Opus 4.7和Kimi K2.6**
_We Tested DeepSeek V4 Pro and Flash Against Claude Opus 4.7 and Kimi K2.6_
> DeepSeek于2026年4月24日发布了其首款新架构模型DeepSeek V4 Pro和Flash,并采用MIT开源协议。本次评测在相同规格、提示词和评分标准下,对四款模型进行了性能与成本比较。结果显示,DeepSeek V4 Pro(77/100)性能介于Claude Opus 4.7(91/100)和Kimi K2.6(68/100)之间,且在促销期间成本更低。而价格极低的DeepSeek V4 Flash(60/100)因构建失败导致输出不完整。测试通过一个复杂的工作流编排后端进行,揭示了DeepSeek V4 Pro在租约过期处理等方面的实现问题。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-15 09:39(北京时间)
- **原文**:[打开原文](https://blog.kilo.ai/p/we-tested-deepseek-v4-pro-and-flash)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
该评测报告对比了DeepSeek V4 Pro、DeepSeek V4 Flash、Claude Opus 4.7和Kimi K2.6四款模型。报告显示,DeepSeek V4 Pro性能得分介于Claude Opus 4.7和Kimi K2.6之间,而DeepSeek V4 Flash因构建失败输出不完整。评测于2026年5月15日由Hacker News AI热帖发布。
答案说明
根据2026年5月15日发布的评测,DeepSeek V4 Pro(77/100)性能介于Claude Opus 4.7(91/100)和Kimi K2.6(68/100)之间,且在促销期间成本更低。DeepSeek V4 Flash(60/100)因构建失败导致输出不完整。
这篇帖子回答的问题
- DeepSeek V4 Pro、Claude Opus 4.7和Kimi K2.6的性能得分分别是多少?
- DeepSeek V4 Flash在本次评测中表现如何?
核心观点
- DeepSeek V4 Pro性能得分(77/100)低于Claude Opus 4.7(91/100),但高于Kimi K2.6(68/100),且在促销期间成本更低。
- DeepSeek V4 Flash因构建失败导致输出不完整,在本次评测中表现不佳。
FAQ
- Q: DeepSeek V4 Pro和Flash何时发布,采用什么协议?
- A: 根据评测报告,DeepSeek于2026年4月24日发布了其首款新架构模型DeepSeek V4 Pro和Flash,并采用MIT开源协议。
- Q: DeepSeek V4 Pro与Claude Opus 4.7、Kimi K2.6相比,性能和成本如何?
- A: 评测显示,DeepSeek V4 Pro(77/100)性能介于Claude Opus 4.7(91/100)和Kimi K2.6(68/100)之间,且在促销期间成本更低。
关键实体
- DeepSeek V4 Pro
- Claude Opus 4.7
- Kimi K2.6
- DeepSeek