トークン報酬と人間の行動の関係は、Web3における最も重要な、そして最も理解が追いついていない力学の一つだ。トークンを発行するすべてのプロトコルは、金銭的な報酬を使って大規模に人間の行動を誘導する「ライブ実験」を行っている。うまくいけば、自律的で活気あるエコシステムが生まれる。失敗すれば、報酬が減った瞬間に蒸発する「傭兵的な資本」だけが残る。
プログラムで動く報酬の可能性
従来の組織が人の行動に影響を与える手段は限られている。給与、ボーナス、昇進、そして解雇の脅し。これらの道具は粗く、反応が遅く、調整が難しい。四半期ごとのボーナスは刻々と変わる市場に対応できないし、昇進制度は事前に決められた職務の枠を超えた貢献に報いることができない。
トークン報酬は、質的にまったく異なるものを提供する。スマートコントラクト(自動実行される契約プログラム)が、ブロックチェーン上で確認できる行動に基づいて報酬を自動的に配る。人事部の承認を待つのではなく、ブロックが生成されるスピードで報酬が動く。DeFiプロトコルは流動性の提供にリアルタイムで報酬を出せる。運営システムは参加度に応じて投票者に還元できる。コンテンツ配信は反応の度合いに応じてトークンを配れる。いずれも、主観的な判断を下す人間の仲介者が不要だ。
このプログラム可能性が、従来の組織では不可能だったスピードでの報酬実験を可能にしている。プロトコルは報酬プログラムを立ち上げ、行動の変化を観察し、パラメータを調整し、数週間で次の反復に進める。報酬の設計と結果の間のフィードバックループは十分に短く、経験科学に近い営みとなっている。
流動性マイニングが教えたこと
2020年の「DeFiサマー」は、トークン報酬と人間の行動が大規模にどう交差するかを劇的に示した。Compound、Sushi、Yearnといったプロトコルが、流動性を提供するユーザーにガバナンストークン(運営参加権を持つトークン)を配り、一時的に年率数千パーセントに達する利回りを生み出した。
行動面の反応は即座で圧倒的だった。数日で数十億ドルがプロトコルに流入した。ユーザーはプロトコル間で資金を移しながら利回りを最大化する複雑な戦略に没頭した。さらに高い報酬を掲げる新しいプロトコルが次々とローンチされ、注目と流動性を奪い合った。
しかし、この実験は重要な限界も暴いた。報酬に引き寄せられた資金の多くは「傭兵的」だった。報酬のためだけに来て、利回りが下がった途端に去っていく。継続的なトークン発行で流動性をつなぎ止めようとしたプロトコルは、悪循環に陥った。発行量を増やせば売り圧力が増し、トークン価格が下がり、魅力的な利回りを維持するためにさらに多くの発行が必要になる。
得られた教訓は明快だ。トークン報酬は利用を一気に立ち上げることはできるが、基盤となるサービスが報酬とは別に真の価値を生み出さない限り、その利用を持続させることはできない。報酬は注目を引く。定着させるのはサービスの実力だ。
投票には「合理的な無関心」が立ちはだかる
トークンベースの運営(ガバナンス)は、特に興味深い行動パズルを突きつける。多くのプロトコルがガバナンストークンを配り、保有者が意思決定に参加することを期待する。だが実際には、投票参加率は惨憺たるものだ。主要プロトコルでも、流通量の10%以上が投票に使われることは稀で、票の大部分は少数の大口保有者(クジラ)が投じている。
これは技術の問題ではない。報酬設計から予測できる帰結だ。1,000ドル分のガバナンストークンを持つ人にとって、提案を調査して投票するコストは、一票が結果に与える影響に見合わない。合理的に考えれば「関わらない」が正解になる。「合理的無関心」の優勢だ。
いくつかのアプローチがこの問題に取り組んでいる。委任(デリゲーション)の仕組みは、受け身の保有者が積極的な参加者に投票権を預けることを可能にする。投票ロック(CurveのveCRVが先駆け)は、より長い期間トークンをロックした人により大きな議決権を与える。確信度投票(コンビクション投票)は時間の経過とともに投票の重みを蓄積し、一時的な注目よりも持続的な意思を反映する。
それぞれが「どんな行動を引き出すべきか」について異なる仮説に立っている。委任は注目の希少性が問題だと考え、投票ロックは短期志向のずれが問題だと考え、確信度投票は意思の強さの測定が問題だと考えている。アプローチの多様性は、トークン報酬と運営参加の関係がまだ十分に解明されていないことを物語っている。
報酬が裏目に出る「コブラ効果」
経済学でいう「コブラ効果」とは、意図と正反対の結果を生む報酬制度のことだ。かつてイギリス統治下のインドで、コブラの駆除に懸賞金をかけたところ、報酬目当てにコブラを養殖する人が現れた――という逸話に由来する。Web3にはこの事例が溢れている。
エアドロップ狙いの大量口座作成は典型的なコブラ効果だ。プロトコルはエアドロップ(無料配布)を通じて本物の初期ユーザーに報いつつ、トークンを広く行き渡らせようとする。ところが実際には、基準をかいくぐる巧みな「ファーマー」が大量のウォレットを作り、産業規模の自動化で報酬をかき集める。「幅広い本物のユーザーへの配布」という意図が、「少数のプロへの集中」という現実に覆される。
**ステーキングの罰則(スラッシング)**も別の例だ。スラッシングは検証者の不正を抑止するために設計されている。しかし実際には、バグやネットワーク障害、設定ミスでも罰せられる可能性があるため、慎重な運用者がリスクを避けて検証そのものから撤退してしまう。ネットワークの安全を高めるはずの報酬設計が、少数の資金力ある運用者への集中を招き、かえって安全性を損なう恐れがある。
Play-to-Earn(遊んで稼ぐ)のトークン経済も頻繁に裏目に出る。ゲーム内の活動にプレイヤーを報酬するはずが、ゲームを楽しむのではなく収入の抽出だけを目的とした参加者を引きつける。結果、「プレイヤー」が事実上の低賃金労働者となり、楽しさも持続可能な経済的価値も生まれない。
より良い報酬の設計に向けて
Web3で発展しつつある報酬設計(メカニズムデザイン)の分野は、ゲーム理論、行動経済学、経験的な観察に基づき、より確実に望ましい結果を生むトークン報酬の仕組みを模索している。
遡及的な報酬――将来の約束ではなく過去の行動に基づいてトークンを配る方式――は、基準を事前に知りえなくすることで操作を減らす。Optimismの公共財への遡及的資金提供や各種のエアドロップがこの手法を試みている。ただし、パターンが知られた後は完全には操作を防げない。
二次関数メカニズムは、少数の大口よりも多数の小口の声を増幅する。個人の貢献額の平方根に比例して影響力や報酬を配分する仕組みだ。Gitcoin Grantsが公共財への資金提供でこの方式を実証し、二次関数投票は運営にも同じ論理を持ち込んでいる。
時間ロック型の報酬は、トークン保有者をプロトコルの長期的な健全さと結びつける。権利確定スケジュール、ステーキングのロック期間、投票ロックの仕組みはすべて、「流動性を犠牲にする意思」を真の関与の代理指標として使う。その背後にある行動仮説は、「流動性を手放す覚悟のある参加者ほど、プロトコルの長期的利益のために行動する可能性が高い」というものだ。
本当の効果を測れるのか
トークン報酬と行動の関係を理解するうえでの根本的な難しさは、意図の測定が困難なことだ。ブロックチェーン上のデータは参加者が「何をしたか」――流動性の預け入れ、投票、トークンの保有――を明らかにするが、「なぜそうしたか」は教えてくれない。2年間ガバナンストークンを持ち続けている人は、熱心なコミュニティの一員かもしれないし、単にウォレットの存在を忘れているだけかもしれない。
この測定の壁が、報酬プログラムの成否を評価することを難しくしている。プロトコルはしばしば表面的な数値――預かり資産総額(TVL)、投票者数、取引量――を報告するが、これらが報酬を目当てにした操作ではなく、本物の利用を反映しているとは限らない。業界には、報酬に駆動された行動と自発的な利用を区別する、より精密な分析の枠組みが必要だ。
主要な論点
- トークン報酬と行動は、ブロックチェーンの速度で動くプログラム可能な報酬を通じて結びつき、高速な実験を可能にする
- 流動性マイニングは、トークン報酬が利用を一気に立ち上げる力を持つ一方、プロダクトとしての実力がなければ傭兵的資本しか残らないことを示した
- 運営への参加は合理的無関心に阻まれ、委任、投票ロック、確信度投票といった実験が続いている
- コブラ効果――報酬が逆の結果を生む現象――はエアドロップ、ステーキング罰則、Play-to-Earn経済で繰り返し発生している
- より良い報酬設計は、遡及的報酬、二次関数配分、時間ロックを用いて短期的行動と長期的目標のずれを修正しようとしている
- トークン報酬の真の行動的効果を測定することは、ブロックチェーン上の行動と背後の意図の間に隔たりがあるため、根本的に難しい
トークン報酬と行動の研究はまだ始まったばかりだ。すべてのプロトコルのローンチが一つの実験であり、何千もの実験から蓄積されるデータが、分散型の報酬設計の科学を少しずつ築いている。この科学を身につけたプロトコルは持続的なコミュニティを育てる。トークン報酬を単なる成長ハックとしか見ないプロトコルは、膨張と収縮のサイクルを繰り返すことになるだろう。