Google DeepMindが、卓球ロボットの研究で画期的な成果を発表しました。ロボットアームがラケットを操り、人間と卓球で対戦するだけでなく、アマチュアレベルの競技力を身につけるまでに進化したのです。
この卓球ロボットの最大の特徴は、同社が「階層的でモジュール化されたポリシーアーキテクチャ」と呼ぶアーキテクチャを採用している点です。フォアハンドやバックハンドといった基本的な技術だけでなく、相手の弱点を見抜いて戦略を立てるといった高度な思考プロセスも組み合わせることで、試合での勝利を目指します。
具体的には、ロボットの動きを細かく制御する最下層、個別の戦術を選択する中間層、試合全体の流れを読む最上位層という3つの階層構造を採用。各層はさらに複数のモジュールに分かれており、柔軟性と再利用性に優れています。
また、カメラとLEDを使った高度なモーションキャプチャシステムや、シミュレーションと現実世界のデータを組み合わせたトレーニングなど、DeepMindが得意とする強化学習の技術も活用されています。
実際の対戦では、初心者レベルの相手には全勝、中級者レベルには55%の勝率を記録しました。しかし、上級者レベルには全敗するなど、まだ課題も残されています。特に、速いボールやスピンのかかったボールへの対応が難しいようです。
研究チームは、このプロジェクトがロボットが実世界のタスクで人間並みのパフォーマンスを発揮するための重要な一歩だと位置づけています。DeepMindは強化学習の先駆者として知られ、AlphaGoなどの成果を着実に積み重ねてきました。今回の卓球ロボットも、より自律的に動くロボット実現に向けた同社の独自アプローチを示す成果と言えるでしょう。