×
成本与时间计算方法说明
成本计算方法
总成本基于每个提供商的输入和输出价格计算:
总成本 = (总输入Tokens ÷ 1,000,000) × 输入价格 + (总输出Tokens ÷ 1,000,000) × 输出价格
- 总输入Tokens = 请求数 × 平均输入Tokens
- 总输出Tokens = 请求数 × 平均输出Tokens
- 价格单位:美元/百万Tokens
- 注:此成本仅包含API调用费用,不包含人力雇佣成本
模型处理时间计算方法
模型处理时间包含两部分:
总时间 = 请求数 × TTFT + 总输出Tokens ÷ 吞吐量
- TTFT (Time To First Token):首个Token的响应时间,单位:秒
- 吞吐量 (Throughput):每秒处理的Token数量,单位:tokens/秒
- 第一部分代表所有请求的初始响应时间总和
- 第二部分代表生成所有输出Token所需的时间
性能数据来源
所有性能数据(TTFT和吞吐量)来自独立第三方基准测试平台 Artificial Analysis,确保数据的客观性和准确性。
硬件规格说明
为保证公平比较,仅包含使用H系列(H100/H200)或类似规格硬件的厂商