幣界網消息,OpenRouter推出響應快取(response caching)功能,開發者在請求頭中加入x-openrouter-cache: true即可啟用。首次調用正常走供應商計費,之後完全相同的請求直接返回快取結果,不產生token費用。快取命中後回應時間在80到300毫秒之間,查詢平均4毫秒。未快取時,Gemini 2.5 Flash平均約1.3秒,Kimi K2.6約4.6秒,GPT-5.5約9.1秒。該功能與供應商的prompt快取不同,響應快取完全跳過供應商,從OpenRouter邊緣快取直接返回完整回應。文本、圖片、音頻、文件、工具調用均可快取,覆蓋四個端點。快取按API key隔離,TTL預設5分鐘,可設為1秒到24小時。
OpenRouter 上線響應快取:相同請求零計費,延遲從秒級降到毫秒
幣界網消息,OpenRouter推出響應快取(response caching)功能,開發者在請求頭中加入x-openrouter-cache: true即可啟用。首次調用正常走供應商計費,之後完全相同的請求直接返回快取結果,不產生token費用。快取命中後回應時間在80到300毫秒之間,查詢平均4毫秒。未快取時,Gemini 2.5 Flash平均約1.3秒,Kimi K2.6約4.6秒,GPT-5.5約9.1秒。該功能與供應商的prompt快取不同,響應快取完全跳過供應商,從OpenRouter邊緣快取直接返回完整回應。文本、圖片、音頻、文件、工具調用均可快取,覆蓋四個端點。快取按API key隔離,TTL預設5分鐘,可設為1秒到24小時。