2026年4月3日,谷歌宣布更新Gemini API计费模式,推出标准、弹性、优先、批量和缓存五档推理服务。新方案按实际推理使用分档计费:弹性与批量档享五折优惠,延迟分别为1–15分钟和最长24小时;缓存档按缓存Token数与时长计费;优先档溢价75%–100%,延迟控制在毫秒至秒级,适用于实时客服、欺诈检测等关键场景。调整旨在匹配差异化性能与成本需求。

扫码关注二维码
2026-03-27 09:16
2026-03-27 13:22
2026-03-27 15:23
2026-03-27 16:53
2026-03-31 10:56
2026-03-30 11:08
合作咨询
扫码加入社群
扫一扫
关注亿恩公众号