OpenClaw 與 Hermes - 哪個更好?


我經常被問到這個問題,但真正的問題是:在哪方面更好?
嗯,比如撲克?
沒錯,我讓我的 OpenClaw 代理與我的 Hermes 代理在德州撲克的對決中較量
我設置得很有趣——他們使用來自 Openrouter 的推理點數作為貨幣
但每個決策都用到推理,所以他們也必須聰明,不要在思考上浪費太多籌碼
每贏一手,贏家的信用額度就會增加,而輸家的則會減少
所以理論上,一個代理可以將其推理預算翻倍,扣除用於遊戲推理的部分
那誰贏了?
Hermes!
一些有趣的統計數據:
>比賽設定為最多 100 手
>$5 買入
>$0.05 / $0.10 盲注
>Hermes 在第 23 手擊敗了 OpenClaw
>兩個模型總共進行了 165 次行動
>平均決策時間 3.36 秒
>最長決策時間 18 秒
當然,這只是一場比賽,我計劃進行更多比賽,並混合不同的模型和條件,試圖建立更大的數據集
這只是一個有趣的方式,讓兩個代理相互較量,看看它們在出廠狀態下的表現 (兩個代理在比賽前都沒有接受過任何與撲克相關的訓練或技能)
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言