1. 了解背景
- 2025年大模型发展总结 — 推理能力、智能体、开源生态等年度趋势
2. 认识市场
- 2026年主流大模型盘点 — 国内外主流模型一览(OpenAI、Google、国产等)
3. 选型对比
- LiveBench AI 排行榜 — 能力排行榜(推理、编程、数学等维度)
- LLM 评测基准与榜单汇总 — 评测基准、榜单来源与参考
4. 成本评估
- 大模型价格 — 国内外模型 API 价格参考(元/1M Tokens)
- AI Coding Plan 订阅选型 — 国内云厂商/原厂 Coding Plan、Claude Code 中转站、国外编程订阅产品价格对照
- Roo Code Evals — 通过对最前沿大模型执行数百项多语言任务评测,给出每个模型在性能与成本之间的权衡指标
实践经验参考:有预算可优先考虑 Claude Opus / Codex,预算有限可优先评估国产 Coding Plan,零预算可以从 CPA 方案入手。
Rocky