@insidersdotbot の開発にあたり、数多くのハイフリクエンシー市場メイク・アービトラージチームと議論を重ねてきました。最も多く寄せられたのは、「効果的なアービトラージ戦略をどう構築するか」という問いです。
私たちのユーザーやパートナーは、@Polymarket 上で複雑かつ多次元的なアービトラージの道を探っています。Twitterを利用していれば、「予測市場でYのアービトラージ戦略を使ってXの利益を得た」といった投稿を目にしたことがあるでしょう。
しかし、多くの記事はアービトラージの本質的なロジックを過度に単純化し、「誰でもできる」や「Clawdbotを使うだけ」といった説明に終始し、独自のアービトラージシステムを構築するための体系的な解説はほとんどありません。
Polymarketのアービトラージツールが実際にどのように利益を生み出しているかを深く理解したい方には、@RohOnChain の本記事を強くおすすめします。これまでで最も網羅的な分析です。
前回の記事同様、原文には高度な技術内容が含まれるため、主要なポイントを追加調査なしで理解できるよう再構成・補足を行っています。
Polymarketで次のような市場を見つけたとします。
YES価格 $0.62、NO価格 $0.33。
「0.62 + 0.33 = 0.95、1未満なのでアービトラージの機会だ!」と考えます。YESとNO両方を$0.95で購入すれば、どちらの結果でも$1.00を受け取れるので$0.05の利益です。
この考え方は正しいです。
しかし、問題はここからです。あなたが手作業で計算している間に、クオンツシステムは全く異なる処理を行っています。
彼らは17,218条件、2^63通りの結果組み合わせを同時にスキャンし、ミリ秒単位で全ての価格の不整合を特定します。あなたが注文を出す頃には、スプレッドは消滅しています。システムはすでに関連市場で同様の非効率性を検出し、板厚や手数料も考慮した最適なポジションサイズを計算し、取引を並列実行し、次の機会へ資本を移動済みです[1]。
この差は単なるスピードではなく、数学的なインフラの違いです。
簡単な例を考えます。
市場A:「トランプはペンシルベニア州で勝利するか?」
YES価格 $0.48、NO価格 $0.52。合計$1.00。
一見、アービトラージの余地はないように見えます。
実は違います。
もう一つ市場を加えると、状況が変わります。
市場B:「共和党はペンシルベニア州で5ポイント以上の差で勝利するか?」
YES価格 $0.32、NO価格 $0.68。これも合計$1.00。
それぞれの市場は「正常」に見えますが、論理的な依存関係があります。
米大統領選は州ごとに決まります。各州は独立した「バトルグラウンド」で、得票数が多い方が全選挙人を獲得します(勝者総取り方式)。トランプは共和党の候補者です。したがって「共和党がペンシルベニア州で勝利」=「トランプがペンシルベニア州で勝利」となります。さらに「5ポイント以上の差で勝利」なら、トランプは圧倒的な勝利を収めたことになります。
つまり、市場BのYES(共和党の圧勝)は、市場AのYES(トランプ勝利)の部分集合です。圧勝なら必ず勝利ですが、勝利しても必ずしも圧勝とは限りません。
この論理的依存関係がアービトラージの機会を生み出します。
これは「明日雨が降るか?」と「明日雷雨になるか?」に賭けるのと同じです。雷雨なら必ず雨が降ります(雷雨⊆雨)。したがって「雷雨YES」は「雨YES」より高く価格付けされることはありません。もし市場がこれを誤って価格付けすれば、同時に安く買って高く売ることでリスクなしに利益を得られます。これがアービトラージです。
n個の条件がある市場では、2^n通りの価格の組み合わせが存在します。
簡単そうに思えるかもしれませんが、実例を考えてみましょう。
2010年のNCAAトーナメント市場[2]:63試合、それぞれ勝敗が決まります。2^63=9,223,372,036,854,775,808通り——9京以上の組み合わせです。市場には5,000以上のオーダーブックが存在しました。
2^63がどれほど大きいか?1秒間に10億通りチェックしても、全てを網羅するのに約292年かかります。したがって総当たり探索は現実的ではありません。
全ての組み合わせを個別にチェックするのは、計算上不可能です。
さらに、2024年米大統領選の場合、研究者は1,576ペアの市場間依存関係を発見しました[2]。それぞれ10条件なら、ペアごとに2^20=1,048,576通り。1,576ペア分を掛けると膨大な数です。あなたのパソコンが計算を終える頃には選挙はとっくに終わっています。
クオンツシステムは「より高速な総当たり」で解決するのではなく、そもそも総当たりしません。
「どの結果が有効か」を整数計画法[3]で定式化します。
実例:Duke対Cornell市場——各チーム7つのオーダーブック(0〜6勝)、計14条件、2^14=16,384通りの組み合わせ。
ただし制約があります:両チームが5勝以上することはできません。なぜなら準決勝で対戦するため、どちらか一方しか進めません。
整数計画法はこれをどう解くか?たった3つの制約で済みます。
制約1:Dukeの7つのオーダーブックのうち、真となるのは1つだけ(最終勝利数は1つに限られる)。
制約2:Cornellの7つのオーダーブックのうち、真となるのは1つだけ。
制約3:Duke5勝+Duke6勝+Cornell5勝+Cornell6勝≤1(両者が同時に5勝以上は不可)。
3つの線形制約で16,384通りの総当たりを回避できます。
総当たり探索 vs. 整数計画法
つまり、総当たり探索は辞書の全単語を一つずつ読むようなもの。整数計画法は正しいページに直接ジャンプするイメージです。全てを調べる必要はなく、「有効な答え」の条件を記述し、アルゴリズムに誤価格を探させます。
実データ:41%の市場でアービトラージが存在
原論文によると、研究チームは2024年4月〜2025年4月のデータを分析しました[2]:
• 17,218条件をチェック
• 7,051条件で単一市場アービトラージ(41%)
• 中央値の価格乖離:$0.60(本来は$1.00)
• 13件のクロスマーケットアービトラージを確認
中央値$0.60の乖離は、市場がしばしば40%もズレていることを意味します。これは「ほぼ効率的」ではなく、「大きく狙える」状態です。
アービトラージ機会を見つけることと、最適な取引を計算することは別問題です。
単に「平均化」や「価格を微調整」すれば良いわけではありません。現在の市場状態をアービトラージフリー空間に射影し、価格の情報構造を保持する必要があります。
直感的には「最も近い有効価格」を見つけて、その差で取引する方法が考えられます。
数学的にはユークリッド距離||μ - θ||²の最小化です。
しかし、これは全ての価格変化を同等に扱います。
$0.50→$0.60と$0.05→$0.15はいずれも$0.10の変化ですが、情報量は大きく異なります。
なぜか?価格は暗示確率を表しているためです。50%→60%は中程度の調整ですが、5%→15%は「ほぼ不可能」から「ある程度可能」への大きな変化です。
体重を例にすると、70kg→80kgは「少し増えた」ですが、30kg→40kg(成人の場合)は「瀕死から重度栄養失調」への変化。同じ10kgでも意味合いは全く異なります。0や1付近の価格変化は、より大きな情報を持ちます。
PolymarketのマーケットメイカーはLMSR(Logarithmic Market Scoring Rule)[4]を採用しており、価格は確率分布を表します。
この場合、正しい距離尺度はユークリッド距離ではなく、Bregmanダイバージェンス[5]です。
LMSRでは、BregmanダイバージェンスはKLダイバージェンス(Kullback-Leiblerダイバージェンス)[6]となり、2つの確率分布間の「情報距離」を測ります。
式を覚える必要はありません。ポイントは:
KLダイバージェンスは極端な価格変化に自動的に大きな重みを与えます。$0.05→$0.15は$0.50→$0.60より「遠い」と評価されます。直感通り、極端な価格変動ほど情報ショックは大きいのです。
例として、@zachxbtの予測市場では、Axiomが終盤でMeteoraを逆転、極端な価格変動が起こりました。
Bregman射影 vs. ユークリッド射影
論文の主要結論:
任意の取引から得られる最大保証利益は、現在の市場状態とアービトラージフリー空間とのBregman射影距離に等しい。
つまり、市場価格が「有効空間」から離れるほど稼げます。Bregman射影は次のことを示します:
- 何を売買すべきか(射影方向=取引方向)
- どれだけ売買すべきか(板厚考慮)
- 最大いくら稼げるか(射影距離=最大利益)
トップアービトラージャーは1年間で$2,009,631.76の利益を上げました[2]。彼らの戦略はこの最適化問題を誰よりも速く、正確に解くことだけでした。
限界ポリトープとアービトラージ
山の上に立ち、ふもとに川(アービトラージフリー空間)が流れているとします。今の位置(市場価格)は川から離れています。
Bregman射影は「現在地から川までの最短経路」を導きます。直線距離ではなく、地形(市場構造)を考慮した最短経路です。その長さが最大利益となります。
最適アービトラージを計算するにはBregman射影が必要です。
しかし問題があります——Bregman射影の直接計算は現実的ではありません。
なぜか?アービトラージフリー空間(限界ポリトープM)は指数関数的に多くの頂点を持ちます。標準的な凸最適化は全制約集合、すなわち全ての有効結果の列挙が必要ですが、これは大規模には不可能です。
Frank-Wolfeアルゴリズム[7]の優れた点は、一度に全てを解こうとせず、段階的に収束することです。
手順は以下の通りです:
ステップ1:既知の有効結果の小さな集合から開始
ステップ2:この集合内で最適解を探索
ステップ3:整数計画法で新たな有効結果を見つけ、集合に追加
ステップ4:十分に最適化できたか判定。足りなければステップ2に戻る
1回のイテレーションで1頂点ずつ増やします。100回繰り返しても追跡するのは100頂点のみ、2^63にはなりません。
Frank-Wolfeイテレーション
巨大な迷路で出口を探すイメージです。
総当たりは全ての道を歩く方法。Frank-Wolfeはランダムな道を選び、分岐点ごとに「ここから出口への最適方向は?」と「ガイド」(整数計画ソルバー)に尋ね、そちらに進みます。全てを探索する必要はなく、要所で正しい選択をするだけです。
Frank-Wolfeの各イテレーションでは整数線形計画問題を解く必要があります。理論上はNP困難(高速な一般解法は未発見)です。
しかし、Gurobi[8]のような最新ソルバーは構造化された問題なら効率的に解けます。
研究チームはGurobi 5.5を使用。実際の解決時間[2]:
• 初期(試合決着少):1秒未満
• 中盤(30〜40試合決着):10〜30秒
• 終盤(50試合以上決着):5秒未満
なぜ後半が速いのか?結果が確定するほど解空間が縮小し、変数も制約も減り、計算が速くなります。
標準Frank-Wolfeには技術的課題があります。価格が0に近づくとLMSRの勾配が負の無限大となり、不安定化します。
解決策はBarrier Frank-Wolfe:完全なポリトープMではなく、少し「縮小した」M'上で最適化します。縮小パラメータεはイテレーションごとに適応的に減少——安定性のため最初は境界から離し、精度向上のため徐々に境界へ近づけます。
実際には50〜150回のイテレーションで収束します[2]。
論文の重要な発見[2]:
NCAAトーナメントの最初の16試合では、Frank-Wolfeマーケットメイカー(FWMM)と単純な線形制約マーケットメイカー(LCMM)は同程度のパフォーマンス——整数計画ソルバーがまだ遅かったため。
45試合後、初めて30分以内の射影が完了。
以降、FWMMはLCMMより38%高精度な価格付けを実現。
転換点は、結果空間が十分に縮小し、整数計画法で取引ウィンドウ内に解けるようになった瞬間です。
FWMMは前半でウォームアップし、後半で本領発揮して圧倒します。LCMMは堅実ですが限界があります。違いはFWMMが強力な「武器」(Bregman射影)を持つ一方、「装填」(ソルバー待ち)に時間がかかることです。
アービトラージを検出し、Bregman射影で最適取引を計算しました。
次は執行です。
ここで多くの戦略が失敗します。
PolymarketはCLOB(Central Limit Order Book)[9]を採用しています。分散型取引所とは異なり、CLOBでは取引が逐次実行され、全注文が同時に約定する保証はありません。
あなたのアービトラージ計画:
YESを$0.30で買う。NOも$0.30で買う。合計$0.60。どちらの結果でも$1.00受け取り。利益$0.40。
現実:
YES注文送信→$0.30で約定 ✓
あなたの注文で市場価格が動く
NO注文送信→$0.78で約定 ✗
合計コスト$1.08。受取額$1.00。実際は$0.08の損失。
一方の注文だけ成立し、もう一方は不成立。リスクを抱えます。
このため、論文では利益幅が$0.05超の機会のみをカウントしています[2]。それ未満は執行リスクで消滅します。
非アトミック執行リスク
常に提示価格で全て約定できるとは限りません。Volume Weighted Average Price(VWAP)[10]で実質購入価格を計算する必要があります。
研究チームの手法:Polygonチェーンの各ブロック(約2秒ごと)で、全YES取引とNO取引のVWAPを算出。|VWAP_yes + VWAP_no - 1.0| > 0.02ならアービトラージ機会と記録[2]。
VWAPは「実際に支払う平均価格」です。10,000トークン買いたい場合、オーダーブックが$0.30で2,000、$0.32で3,000、$0.35で5,000なら、VWAP=(2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = $0.326。見かけの「最良価格」$0.30より大幅に高くなります。
価格がズレていても、利益は流動性で制限されます。
実例[2]:
市場はアービトラージを示し、YES価格合計$0.85。1ドル当たり$0.15の利益。しかしその価格での板厚は$234のみ。最大抽出利益は$234×0.15=$35.10。
クロスマーケットアービトラージでは全ポジションで同時に流動性が必要。最小流動性が上限となります。
このため、現行のクオンツプラットフォームでは、オーダー価格が執行価格に与える影響が極めて重要です。
これはパブリックβ期間中の課題への回答です。
理論はシンプルですが、運用は複雑です。
実際のアービトラージシステムは以下の通りです[2]。
リアルタイムデータ:PolymarketのAPI[9]にWebSocketで接続し、オーダーブックの更新(価格・数量変化)、取引通知、市場の作成・決済イベントを受信。
過去データ:Alchemy PolygonノードAPI経由でコントラクトイベントを取得——OrderFilled(取引成立)、PositionSplit(新規トークン発行)、PositionsMerge(トークン焼却)。
研究チームは8,600万件の取引を分析しました[2]。この規模にはスクリプトだけでなくインフラが必要です。
P.S. 現在、
では高速取引APIのオープンソース化を計画中です。類似モデルの利用を検討中で早期アクセスを希望される方は、DMでご連絡ください。
米大統領選305市場では46,360ペアの組み合わせをチェックする必要があります。手作業は不可能です。
研究チームはDeepSeek-R1-Distill-Qwen-32B大規模言語モデルを初期スクリーニングに活用しました[2]。
入力:2市場の条件説明。出力:有効な結果組み合わせのJSON。
その後、3段階の検証:各市場に真となる条件が1つだけか?有効組み合わせ数がn×m未満か(依存関係の指標)?依存部分集合がアービトラージ条件を満たすか?
結果:40,057ペアが独立(アービトラージなし)→1,576ペアが依存(潜在的アービトラージ)→374ペアが厳格基準を満たす→13ペアが人手で搾取可能と確認[2]。
多条件市場におけるLLMの精度は81.45%。初期スクリーニングには十分ですが、執行前に手動検証が必要です。
レイヤー1:単純な線形制約(LCMM)。「確率合計は1」「AがBを含意するならP(A)≦P(B)」など基本ルールを高速チェック。ミリ秒単位で明白な誤価格を排除。
レイヤー2:整数計画射影(Frank-Wolfe+Gurobi)。これが中核。パラメータ:Alpha=0.9(アービトラージの90%以上を抽出)、初期ε=0.1(10%縮小)、収束閾値=1e-6、制限時間=30分。典型的なイテレーション数は50〜150。1回あたりの解決時間1〜30秒[2]。
レイヤー3:執行検証。注文提出前に現行板でシミュレーション。流動性は十分か?予想スリッページは?スリッページ込みの保証利益は?利益が最低閾値($0.05)を超えるか?全て満たせば実行。
標準Kelly式[11]は取引に割り当てる資本比率を示します。アービトラージでは執行リスクを加味して調整します:
f = (b×p - q) / b × √p
ここでbはアービトラージ利益率、pは完全約定確率(板厚から推定)、q=1-p。
上限:板厚の50%。これを超えると市場価格への影響が大きくなります。
2024年4月〜2025年4月の総抽出利益[2]:
単一条件アービトラージ:両サイド安値買い$5,899,287+高値売り$4,682,075=$10,581,362
市場リバランス:YES全て安値買い$11,092,286+YES全て高値売り$612,189+NO買い$17,307,114=$29,011,589
クロスマーケット複合アービトラージ:$95,634
合計:$39,688,585
上位10アービトラージャーが$8,127,849(全体の20.5%)を取得。トップは4,049取引で$2,009,632、1取引平均$496[2]。
これは宝くじでも運でもなく、体系的かつ数学的に精緻な執行です。
トレーダーが「10の予測市場Tips」を読んでいる間、クオンツシステムは何をしているのでしょうか?
彼らは17,218条件の依存関係を整数計画法で検出し、Bregman射影で最適アービトラージ取引を計算し、Frank-Wolfeアルゴリズムで勾配爆発を処理し、VWAPでスリッページを見積もり、注文を並列実行し、$4,000万の保証利益を体系的に抽出しています。
違いは運ではありません。数学的インフラの差です。
論文は公開されています[1]。アルゴリズムも既知です。利益も実在します。
本当の問いは——次の$4,000万が抜かれる前に、あなたはこれを構築できますか?
• 限界ポリトープ → 全ての有効価格の集合。この範囲内でなければアービトラージフリーではない。
• 整数計画法 → 線形制約で有効結果を記述し、総当たりを回避。2^63回のチェックを数個の制約に圧縮[3]。
• Bregmanダイバージェンス/KLダイバージェンス → 2つの確率分布間の「距離」を測る。ユークリッド距離より価格・確率シナリオに適切。極端な変化に高い重みを与える[5][6]。
• LMSR(Logarithmic Market Scoring Rule)→ Polymarketのマーケットメイカーが用いる価格決定方式。価格は暗示確率を表す[4]。
• Frank-Wolfeアルゴリズム → 1回ごとに新しい頂点を追加し、指数的な有効結果の列挙を回避する反復最適化アルゴリズム[7]。
• Gurobi → Frank-Wolfe各イテレーションの「ガイド」となる業界標準の整数計画ソルバー[8]。
• CLOB(Central Limit Order Book)→ Polymarketの取引方式。注文は順次執行、アトミック性なし[9]。
• VWAP(Volume Weighted Average Price)→ 板厚を考慮した実質購入価格。「最良気配」より現実的[10]。
• Kelly式 → 収益とリスクのバランスを取りつつ、取引に割り当てる資本比率を示す[11]。
• 非アトミック執行 → 複数注文の同時約定が保証されない問題。一方だけ成立し、もう一方は不成立——リスクが残る。
• DeepSeek → 市場依存性スクリーニングに用いた大規模言語モデル、精度81.45%。
[1] オリジナル投稿: https://x.com/RohOnChain/status/2017314080395296995
[2] 研究論文 “Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets”: https://arxiv.org/abs/2508.03474
[3] 理論的基盤 “Arbitrage-Free Combinatorial Market Making via Integer Programming”: https://arxiv.org/abs/1606.02825
[4] LMSRの解説: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work
[5] Bregmanダイバージェンス入門: https://mark.reid.name/blog/meet-the-bregman-divergences.html
[6] KLダイバージェンス - Wikipedia: https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
[7] Frank-Wolfeアルゴリズム - Wikipedia: https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm
[8] Gurobi Optimizer: https://www.gurobi.com/
[9] Polymarket CLOB APIドキュメント: https://docs.polymarket.com/
[10] VWAP解説 - Investopedia: https://www.investopedia.com/terms/v/vwap.asp
[11] Kelly式 - Investopedia: https://www.investopedia.com/articles/trading/04/091504.asp
[12] Decrypt記事 “The $40 Million Free Money Glitch”: https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets





