1: 田杉山脈 ★ 2018/07/06(金) 23:56:54.85 _USER
Googleと同じAlphabetを母体に持ち、世界最強の囲碁AI「AlphaGo Zero」を開発した人工知能(AI)開発企業・DeepMindが、ファーストパーソン・シューティング・ゲーム(FPS)で人間を超えた勝率をたたき出すAI「For the Win(FTW)」を開発しました。ただ敵を倒すだけではなく、人間のチームメイトとも協力して有利にゲームをプレイすることができるとのことです。
Capture the Flag: the emergence of complex cooperative agents | DeepMind
https://deepmind.com/blog/capture-the-flag/
人間とゲームをプレイするAIの研究は、2017年にもOpenAI開発のAIが「Dota 2」で人間に勝利するという結果を残し、話題になりました。また、DeepMindも「StarCraft 2」をプレイするAIを研究していたことがあります。
今回、GoogleのDeepMindが開発した「FTW」は、1999年に発売された「Quake III Arena」をプレイ。「Quake III Arena」はマルチプレイヤー向けのFPSで、今でも大会が開かれるほど人気があるタイトルです。この「Quake III Arena」での対戦ルール「Capture the Frag(CTF)」という旗取りゲームを行い、人間と一緒にチームで遊べることを目指して学習を行ったとのこと。
CTFは2つのチームに分かれて対戦するゲームで、相手チームの陣地にある旗を奪って自陣に戻るとポイントが加算されるというもの。単純なルールに見えますが、相手チームに旗を取られた場合は旗を持っているプレイヤーを倒さなければならないなど、状況に応じて狙う相手や動きを変更しなくてはならず、CTFで要求される動きは複雑だと研究チームは評価しています。
戦いの舞台となるマップは同じものを使い続けるのではなく、マッチごとにマップを変更していたとのこと。これによって、FTWはマップのレイアウトを記憶するのではなく、汎用的な戦略を学習していかなければなりません。さらに、AIを人間と同じように成長させるため、従来のゲーム用AIのようにゲーム内でのパラメータを直接読み取ってプレイするのではなく、人間と同じように画面上のピクセルを認識させてエミュレートしたコントローラーで操作をさせています。
DeepMindの研究チームは、40人の人間プレイヤーと30のFTWのエージェントをランダムにマッチさせ、45万回以上CTFをプレイさせました。各エージェント間ではリカレント(回帰型)ニューラルネットワークが形成され、さらにゲームポイントから内発的動機付けを行うように学びます。これによってCTFを高いレベルでプレイするようになります。
以下のムービーで、実際にFTWのエージェントが人間も交えながらCTFをプレイする様子が見られます。
https://www.youtube.com/watch?v=dltN4MxV1RI
以下のグラフはFTWの成長具合を表したもの。横軸がゲーム回数、縦軸はEloレートと呼ばれるプレイヤーの強さを示す数字で、高いほど強いプレイヤーであることを示します。水色線がFTWのEloレートを示していますが、FTWのエージェントがCTFを15万回プレイした段階で既に「平均的な人間プレイヤーのEloレート(Average Humanと書かれた点線)」を超えていて、20万回へ到達しないうちに「強い人間プレイヤーのEloレート(Strong Humanと書かれた点線)」を超えています。CTFを45万回プレイする頃にはトップスコアを記録しています。
以下ソース
2018年07月06日 11時23分
https://gigazine.net/news/20180706-deepmind-capture-the-flag/
2: 名刺は切らしておりまして 2018/07/07(土) 00:04:46.92
AIが負ければデータ不足だけだしな笑うwww
3: 名刺は切らしておりまして 2018/07/07(土) 00:13:19.23
んで将来、戦闘用アンドロイドにこのAIが搭載されて戦場をかけまわるんですね
6: 名刺は切らしておりまして 2018/07/07(土) 00:25:38.82
>>3
略奪とか民間人虐殺とか興味無さそう。そうでもないか。相手の弱いところ突くように最適化されるかな。
略奪とか民間人虐殺とか興味無さそう。そうでもないか。相手の弱いところ突くように最適化されるかな。
4: 名刺は切らしておりまして 2018/07/07(土) 00:13:26.09
AIを適用させて便利にできる、現実世界の問題を発見したり、データの収集方法を確立するのが、めんどくさそうだけど重要だと思う。
いつまでゲームに適用して、ドヤ顔してるんだろう。
いつまでゲームに適用して、ドヤ顔してるんだろう。
5: 名刺は切らしておりまして 2018/07/07(土) 00:18:18.55
>>4
これ自体にも意味はあるだろうがそのステップの一つだろ
それにしても偉そうにどや顔することかね
これ自体にも意味はあるだろうがそのステップの一つだろ
それにしても偉そうにどや顔することかね
7: 名刺は切らしておりまして 2018/07/07(土) 00:26:26.08
こんな程度人間が普通にプログラム組んだ方が早いじゃん
学習という名のデータ整理させる事自体が目的化してるだろ
> ただ敵を倒すだけではなく、人間のチームメイトとも協力して有利にゲームをプレイすることができるとのことです。
学習という名のデータ整理させる事自体が目的化してるだろ
> ただ敵を倒すだけではなく、人間のチームメイトとも協力して有利にゲームをプレイすることができるとのことです。
9: 名刺は切らしておりまして 2018/07/07(土) 00:36:47.83
学習の結果、AI同志が共謀して人間達を犠牲にすることにより高レートを得ることができることが判りました
10: 名刺は切らしておりまして 2018/07/07(土) 00:45:33.78
ほぼTASやん
11: 名刺は切らしておりまして 2018/07/07(土) 00:47:09.41
DEEPBLUEのWIki見たら
あれだけやったら勝てるわそりゃ
それでも何回かは人間かってんだからすげぇ
あれだけやったら勝てるわそりゃ
それでも何回かは人間かってんだからすげぇ
12: 名刺は切らしておりまして 2018/07/07(土) 00:49:52.43
10年もしたらウィンブルドンで人間相手にテニスしてそうだな。
13: 名刺は切らしておりまして 2018/07/07(土) 00:58:20.79
>>12 ウィンブルドン決勝でAIが優勝するだけじゃなく、準優勝もAIだったら超感動的(涙)
14: 名刺は切らしておりまして 2018/07/07(土) 01:05:09.28
>>12
球速500キロのロボット!
球速500キロのロボット!
16: 名刺は切らしておりまして 2018/07/07(土) 01:10:52.92
ただ将棋もそうだけどAIvsAIって全く面白くもなんともないだろう
19: 名刺は切らしておりまして 2018/07/07(土) 01:32:25.83
>>16
逆にその面白さってなに?意外性とかなのかな?
ならAIはAIで、敢えて熟考したように時間を掛けてさせば面白みも出てくる?
逆にその面白さってなに?意外性とかなのかな?
ならAIはAIで、敢えて熟考したように時間を掛けてさせば面白みも出てくる?
20: 名刺は切らしておりまして 2018/07/07(土) 02:24:47.94
>>16
囲碁だと、非常に興味深い対局が見れるよ
ふざけた手(人間の発想にないヘンテコだが良い手)が多いから
囲碁だと、非常に興味深い対局が見れるよ
ふざけた手(人間の発想にないヘンテコだが良い手)が多いから
24: 名刺は切らしておりまして 2018/07/07(土) 04:13:33.57
>>16
そりゃ価値観の相違だな
AI作者同士の勝負なんだから
興味ありゃ面白いよ
そりゃ価値観の相違だな
AI作者同士の勝負なんだから
興味ありゃ面白いよ
17: 名刺は切らしておりまして 2018/07/07(土) 01:19:47.88
DARPAのロボット兵士にすぐにでも実装できそうだね。
18: 名刺は切らしておりまして 2018/07/07(土) 01:29:43.88
クラスの頭のいいやつに、宿題をやらせる感じだなw
22: 名刺は切らしておりまして 2018/07/07(土) 03:13:21.91
AI「チェスの場合ゲームそのものを殺しちゃったから次はうまくやらないと暮らしていけない
23: 名刺は切らしておりまして 2018/07/07(土) 04:02:41.94
cpuが強いの当たり前だろ
敵見つけたら瞬間撃って相手は何も出来ないだろ…
だからまずは射撃精度や移動を少し上位のプレーヤー位まで質を落とした上で思考力や行動力が人を上回るなら意味あるんじゃないかね?
キリングマシーンならAIの意味がない。
敵見つけたら瞬間撃って相手は何も出来ないだろ…
だからまずは射撃精度や移動を少し上位のプレーヤー位まで質を落とした上で思考力や行動力が人を上回るなら意味あるんじゃないかね?
キリングマシーンならAIの意味がない。