OpenClaw 対 Hermes - どちらが優れているか?


その質問はよく受けますが、本当の質問は:何に対して優れているのか?
そうですね、ポーカーはどうでしょう?
はい、私のOpenClawエージェントに私のHermesエージェントとテキサスホールデムのバトルをさせました
設定を面白くしました - 彼らはOpenrouterの推論クレジットを通貨として使用しました
しかし、各決定には推論が必要だったので、彼らも賢くなければならず、あまり考えすぎてスタックを無駄にしないようにしなければなりませんでした
各ハンドに勝つと、勝者のクレジット制限が増加し、敗者の制限が減少しました
したがって、理論的には、1つのエージェントが推論予算を倍にできる可能性があり、ゲームをプレイするために使用された分を差し引きます
では、誰が勝ったのでしょうか?
Hermesです!
いくつかの興味深い統計:
>ゲームは最大100ハンドに設定
>$5 ベット額
>$0.05 / $0.10のブラインド
>Hermesは23ハンドでOpenClawを破った
>両モデル間の合計アクション数は165
>平均決定時間は3.36秒
>最長決定時間は18秒
もちろん、これは一つの試合に過ぎません。もっと多くの試合を行う予定で、モデルや条件を変えて、より大きなデータセットを作成しようと考えています
これは、両エージェントを対戦させて、彼らがどのようにパフォーマンスを発揮するかを見る面白い方法でした (どちらのエージェントも、試合前にポーカーに関する訓練やスキルを受けていませんでした)
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン