倍率设置¶
倍率设置是 NewAPI 计费系统的核心配置,通过设置不同的倍率可以灵活控制各种模型和用户组的计费标准。
倍率系统概述¶
NewAPI 使用三层倍率体系来计算用户的配额消耗:
- 模型倍率(ModelRatio) - 定义不同AI模型的基础计费倍数
- 补全倍率(CompletionRatio) - 对输出token进行额外计费调整
- 分组倍率(GroupRatio) - 为不同用户组设置差异化计费倍数
配额与倍率的关系¶
在 New API 系统中,倍率是计算配额消耗的关键参数。配额是系统内部的计费单位,所有的API调用最终都会转换为配额点数进行扣减。
配额单位转换:
- 1 美元 = 500,000 配额点数
- 配额点数是系统内部计费的基础单位
- 用户的余额、消费记录都以配额点数为准
配额计算公式¶
按量计费模型(基于Token消耗)¶
按次计费模型(固定价格)¶
音频模型(特殊处理,new-api内部自动处理)¶
预消费与后消费机制¶
New API 采用预消费和后消费的双重计费机制:
- 预消费阶段:API调用前,根据预估token数计算配额消耗并预扣
- 后消费阶段:API调用完成后,根据实际token数重新计算配额消耗
- 差额调整:如果实际消耗与预消费不同,系统会自动调整用户配额余额
模型倍率设置¶
模型倍率定义了不同AI模型的基础计费倍数,系统为各种模型预设了默认倍率。
常见模型倍率示例¶
模型名称 | 模型倍率 | 补全倍率 | 官网价格(输入) | 官网价格(输出) |
---|---|---|---|---|
gpt-4o | 1.25 | 4 | $2.5/1M Tokens | $10/1M Tokens |
gpt-3.5-turbo | 0.25 | 1.33 | $0.5/1M Tokens | $1.5/1M Tokens |
gpt-4o-mini | 0.075 | 4 | $0.15/1M Tokens | $0.6/1M Tokens |
o1 | 7.5 | 4 | $15/1M Tokens | $60/1M Tokens |
倍率含义说明:
- 模型倍率:相对于基础计费单位的倍数,反映模型的成本差异
- 补全倍率:输出token相对于输入token的计费倍数,反映输出成本差异
- 倍率越高,消耗的配额越多;倍率越低,消耗的配额越少
设置方法¶
- JSON格式设置:直接编辑模型倍率JSON配置
- 可视化编辑器:通过图形界面设置倍率
补全倍率设置¶
补全倍率用于对输出token进行额外计费,主要用于平衡不同模型的输入输出成本差异。
默认补全倍率¶
模型类型 | 官网价格(输入) | 官网价格(输出) | 补全倍率 | 说明 |
---|---|---|---|---|
gpt-4o | 2.5$/1M Tokens | 10$/1M Tokens | 4 | 输出是输入的4倍 |
gpt-3.5-turbo | 0.5$/1M Tokens | 1$/1M Tokens | 2 | 输出是输入的2倍 |
gpt-image-1 | 5$/1M Tokens | 40$/1M Tokens | 8 | 输出是输入的8倍 |
gpt-4o-mini | 0.15$/1M Tokens | 0.6$/1M Tokens | 4 | 输出是输入的4倍 |
其他模型 | 1 | 1 | 1 | 输出是输入的1倍 |
设置说明¶
- 补全倍率主要影响输出token的计费
- 设置为1表示输出token计费与输入token计费相同
- 大于1表示输出token计费更高,小于1表示输出token计费更低
分组倍率设置¶
分组倍率允许为不同用户组设置差异化的计费倍数,实现灵活的定价策略。
分组倍率配置¶
分组倍率优先级¶
- 用户专属倍率:为特定用户设置的个人倍率
- 分组倍率:用户所属分组的倍率
- 默认倍率:系统默认倍率(通常为1.0)
可视化倍率设置¶
可视化编辑器提供了直观的倍率管理界面,支持:
- 批量编辑模型倍率
- 实时预览倍率配置
- 冲突检测和提示
- 一键同步上游倍率
未设置倍率模型¶
对于未设置倍率的模型,系统会:
- 自用模式:使用默认倍率37.5
- 商业模式:提示"倍率或价格未配置"错误
- 自动检测:在管理界面显示未配置的模型
上游倍率同步¶
系统支持从上游渠道自动同步倍率设置:
- 自动获取上游模型倍率
- 批量更新本地倍率配置
- 保持与上游价格同步
- 支持手动调整和覆盖
常见问题¶
Q: 如何为新模型设置倍率?¶
A: 可以通过可视化编辑器添加新模型,或直接在JSON配置中添加。建议先设置保守倍率,根据实际使用情况调整。
Q: 分组倍率如何生效?¶
A: 分组倍率会与模型倍率相乘,最终影响用户的配额消耗计算。用户的实际倍率 = 模型倍率 × 分组倍率。
Q: 补全倍率的作用是什么?¶
A: 补全倍率主要用于平衡输入输出token的成本差异。某些模型的输出成本远高于输入成本,需要通过补全倍率进行调整。
Q: 如何批量设置相似模型的倍率?¶
A: 可以通过可视化编辑器进行批量操作,或者直接在JSON配置中批量添加相似模型的倍率设置。
配额计算实例¶
示例1:GPT-4 标准用户对话¶
场景参数:
- 输入token:1,000
- 输出token:500
- 模型倍率:15
- 补全倍率:2
- 分组倍率:1.0(标准用户)
计算过程:
等价美元成本:30,000 ÷ 500,000 = $0.06
示例2:GPT-3.5 VIP用户对话¶
场景参数:
- 输入token:2,000
- 输出token:1,000
- 模型倍率:0.25
- 补全倍率:1.33
- 分组倍率:0.5(VIP用户50%折扣)
计算过程:
等价美元成本:416.25 ÷ 500,000 = $0.00083
示例3:按次计费模型(如Midjourney)¶
场景参数:
- 模型固定价格:$0.02
- 分组倍率:1.0(标准用户)
- 配额单位:500,000
计算过程:
等价美元成本:10,000 ÷ 500,000 = $0.02
有关更多计费规则,请查看常见问题