OpenRouter 上線響應快取:相同請求零計費,延遲從秒級降到毫秒

robot
摘要生成中

幣界網消息,OpenRouter推出響應快取(response caching)功能,開發者在請求頭中加入x-openrouter-cache: true即可啟用。首次調用正常走供應商計費,之後完全相同的請求直接返回快取結果,不產生token費用。快取命中後回應時間在80到300毫秒之間,查詢平均4毫秒。未快取時,Gemini 2.5 Flash平均約1.3秒,Kimi K2.6約4.6秒,GPT-5.5約9.1秒。該功能與供應商的prompt快取不同,響應快取完全跳過供應商,從OpenRouter邊緣快取直接返回完整回應。文本、圖片、音頻、文件、工具調用均可快取,覆蓋四個端點。快取按API key隔離,TTL預設5分鐘,可設為1秒到24小時。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆