Subscribed unsubscribe Subscribe Subscribe

メッシとAmazon(中編)

サッカー選手をエージェントとみたてて、計算機上でシミュレーションする。あるルールにそって動作させたとき、効率よくゴールを決めたり、鉄壁な守りを実現するチームプレーを発現させるようなルールとはどんなものだろうか。


http://www.flickr.com/photos/-po/9508337865
Rio Tinto Stadium by Brent Thomson, on Flickr


現実世界では、あるコーチはパスワークの重要性を、またある指導者は個々人のテクニック強化の必要性を解くかもしれない。では、コーチたちはどうやってそのルールを考案したのだろうか。


実際にサッカープレイヤーだった経験から、もしくは多くの試合を観戦することで重要なポイントを発見したといったところが王道だろうか。一般的には、これらのプロセスは「学習」と呼ばれる。


では、もし、コンピュータが自ら学習することができたら・・・?


機械学習というのは、これを実現する手法(アルゴリズム)である。簡単に言えば、何度も試行しながら徐々に最適なパラメータを発見する仕組みだ。


再びマルチエージェントシステム上のサッカーを考えてみる。例えば各エージェントに次のようなルールを与えたとする

  • ボールに近づく:10m以内にボールがある場合
  • パスを出す:敵が5m以内にいて、仲間が30m以内にいる場合
  • シュートする:シュートスキルが10以上でゴールから距離が(5×シュートスキル)m以内の場合
  • ドリブルする:その他の場合

このようなルールのモデルを組み立てた場合、10mとか5mとかいう部分をパラメータとみなすことができる。この値を適切なものにすることで、強いチームを作ることができそうだ。そして、適切なパラメータの組み合わせは、強豪チームを作るエージェントの動作ルールに他ならない。


これを実現するのが機械学習である。あるパラメータからスタートしてサッカーの試合をシュミレーションし、結果に応じて *1これらのパラメータを少しずつ変化させる。そしてまたシミュレーションをして、というのを繰り返す。十分な回数の試行をへてパラメータの値が収束したところでシミュレーションを終了する*2


機械学習アルゴリズム(パラメータを修正する方法)はいくつも提案されている。人間の神経組織を模して考案されたニューラルネットワーク。やや統計学よりなサポートベクターマシン。生物の進化過程にヒントを得た遺伝的アルゴリズム*3などが有名だ。


この機械学習を上手く使えば、コンピュータリソースを使い、ある規模のデータサンプルから人間では思いもつかないルールを発見することができるかもしれない・・・。こんなポテンシャルを前にして、世の中が興奮するのも無理は無い。


そこには途方もなく大きなビジネスチャンスがある。


知の創成―身体性認知科学への招待
ロルフ ファイファー クリスチャン シャイアー
共立出版
売り上げランキング: 707,280

*1:例えば獲得得点が多くボール占有率が高い結果を生むパラメータセットを高く評価する

*2:全ての取りうるパラメータの組み合わせを虱潰しに全部試してみればよいじゃないか、という疑問を持った人は、なぜそれが成り立たないか考えてみてほしい

*3:15年ぐらい前にSONYから発売された犬型ロボットAIBOの四足歩行動作は遺伝的アルゴリズムで獲得された、というのは有名な話