模型对比 & 价格
模型对比表
高端模型
| 模型 | 提供商 | 上下文窗口 | 输入价格* | 输出价格* | 推荐用途 |
|---|---|---|---|---|---|
| Claude Sonnet 4.5 | Anthropic | 1M tokens | $3-6 | $15-22.50 | 稳定的工具使用、复杂代码库 |
| GPT-5 | OpenAI | 400K tokens | $1.25 | $10 | OpenAI 最新技术,3 种模式 |
| Gemini 2.5 Pro | 1M+ tokens | TBD | TBD | 大型代码库、文档分析 | |
| Qwen3 Coder | Multiple | 256K tokens | $0.20 | $0.80 | 编码任务、开源灵活性 |
*每百万令牌
预算型模型
| 模型 | 提供商 | 上下文窗口 | 输入价格* | 输出价格* | 备注 |
|---|---|---|---|---|---|
| DeepSeek V3 | DeepSeek | 128K tokens | $0.14 | $0.28 | 日常编码性价比高 |
| DeepSeek R1 | DeepSeek | 128K tokens | $0.55 | $2.19 | 低成本推理优势 |
| Qwen3 32B | Multiple | 128K tokens | Varies | Varies | 开源、多提供商 |
| Z AI GLM 4.5 | Z AI | 128K tokens | TBD | TBD | MIT 许可,混合推理 |
*每百万令牌
性能对比
速度 vs 质量取舍
| 优先级 | 推荐模型 | 原因 |
|---|---|---|
| 速度 | Cerebras 的 Qwen3 Coder | 推理速度最快 |
| 质量 | Claude Sonnet 4.5 | 复杂任务最稳定 |
| 平衡 | DeepSeek V3 | 低成本且质量不错 |
工具可靠性
按工具使用稳定性排序:
- Claude Sonnet 4.5 - 最稳定
- GPT-5 - 很好但偶有格式问题
- Gemini 2.5 Pro - 标准工具表现强
- DeepSeek V3 - 基本工具稳定
- Qwen3 系列 - 复杂工具需重试
成本计算
常见任务成本示例
| 任务类型 | 平均令牌 | Claude Sonnet | DeepSeek V3 | 差异 |
|---|---|---|---|---|
| 简单 Bug 修复 | 5K tokens | $0.05 | $0.001 | 便宜 50 倍 |
| 功能实现 | 50K tokens | $0.50 | $0.01 | 便宜 50 倍 |
| 大规模重构 | 200K tokens | $2.00 | $0.04 | 便宜 50 倍 |
月度预算场景
| 预算 | Claude 用量 | DeepSeek 用量 | 混合策略 |
|---|---|---|---|
| $10/月 | ~20 功能 | ~1000 功能 | Plan: DeepSeek, Act: Claude |
| $50/月 | ~100 功能 | ~5000 功能 | 核心: Claude, 日常: DeepSeek |
| $100/月 | ~200 功能 | ~10000 功能 | 复杂: Claude, 简单: DeepSeek |
提供商对比
提供商特性
| 提供商 | 提供模型 | 计费方式 | 稳定性 | 支持 |
|---|---|---|---|---|
| Careti | 多模型 | 额度制 | 高 | 应用内 |
| Anthropic | Claude 专用 | 按量 | 高 | 邮件 |
| OpenRouter | 100+ 模型 | 按量 | 高 | Discord |
| OpenAI | GPT 专用 | 按量 | 高 | 论坛 |
| 本地(Ollama) | 开源 | 免费 | N/A | 社区 |
提供商选择指南
- 便捷: Careti (无需管理 API Key)
- 多样性: OpenRouter (几乎所有模型)
- 直连: Anthropic/OpenAI
- 隐私: Ollama/LM Studio
社区使用统计
实时使用统计:
- OpenRouter Careti 使用统计
- 热门模型: Claude Sonnet 4.5 (40%)
- 增长模型: DeepSeek V3 (25%)
- 性价比偏好: Qwen3 系列 (20%)