logo

私たちは革命の最中にいる--将棋AIでプロ棋士に勝ったエンジニアの語る未来

  • このエントリーをはてなブックマークに追加

  「将棋の世界ではシンギュラリティが起こった」――そう語るのは将棋ソフト「Ponanza」の開発者である山本一成氏。そして、そのAIをビジネスに展開する「HEROZ」という企業がある。2月27日に開催された「CNET Japan Live 2018」において、HEROZ 開発部 リードエンジニアの山本一成氏と、同社開発部 プロデューサーの大井恵介氏が“人工知能はどのようにして現役の将棋名人を超えたのか、そしてこれからどうなるのか?~HEROZ Kishin AIの活用最前線~”と題した講演を行った。

山本一成氏
山本一成氏

 HEROZは、ディープラーニングを含めた機械学習で将棋を指すソフトのPonanzaを開発した山本氏が所属する企業だ。現在、そのAI関連手法を将棋に限らずさまざまな課題を解決するAIとして進化させた「HEROZ Kishin」を提供している。

 山本氏は12年前に大学を留年したことをきっかけに将棋ソフトの開発を始めたのだという。「将棋はアマ五段だったので、将棋の知識とコンピュータの計算力でものすごい強い将棋のプログラムができるに違いないと考えた。3カ月掛かってプログラムはできたが、非常に弱かった。そこで8枚落ちという大きなハンデを付けたが、それでも自分が勝ってしまった。初めて作ったプログラムは非常に弱いというのが、私と人工知能の出会いだった」と語る。

 「私は将棋のことをよく知っていると確信していた。ところが、失敗だった。将棋を論理的に説明できなければ、プログラムを書くことはできないと気づいた。これが、私の行き詰まりであり、全盛期の人工知能の行き詰まりでもあった。自分が知っているものは言葉にならない。同様に、職人芸や達人芸は、それを言葉で論理的に説明できないからこそ職人芸と言われている。言葉にできないものはプログラムに書くことができない」(山本氏)。 現在では、将棋プログラムは劇的に強くなった。その理由として、この10年間で人工知能が爆発的に成長したからだと山本氏は説明する。

人工知能の強みは圧倒的な経験値

 論理的ではないものをプログラムにする課題をどうやって解決したか。山本氏は「今、将棋のプログラムは1万行ぐらいで中小規模程度。そんなに大きくはない。そのプログラムに将棋のすべてが書いてあるわけではない。プログラム以外に、人工知能自身が学習した部分がある。約2億のパラメータで構成されている」と語る。

 「プログラムには、将棋の基礎的なルールだけでなく、どうやって機械が将棋を勉強するかが書いてある。分野の知識を記述するのでははなく、その勉強法が書いてある。プログラムはその勉強法に従って勉強をする。勉強した結果、人とコンピュータ、つまり人機一体になったものが人工知能である」(山本氏)。

将棋プログラムはプログラムと人工知能で構成されている
将棋プログラムはプログラムと人工知能で構成されている

 山本氏は、現在の人工知能の傾向としては人が書いている部分が減ってきており、減るべきだと語る。また、人工知能が任せた方が良い結果になりやすく、未来についてもその傾向は高まるとの推測も述べた。

 現在は、“強化学習”という勉強法が主流になっているという。「例えば、ピアノがうまくなりたいと思ったら、ピアノが上手な先生やテキストに教わるのが上達の近道だ。しかし、世界一になりたかったらテキストも先生も信用できない。そうなれば、自分で切り開いて行き、失敗したり成功したりのフィードバックを得ることでうまくなるしかない。これはピアノに限ったことではなく、あらゆることに通じる話だ」(山本氏)。

 「将棋プログラムでは、8000億局面ぐらい調べた。その結果、将棋のプログラムが強くなった。単純に記憶力や計算力があるから、人間を追い越しているという分野ではない。いま人工知能が人間を上回っているのは、人工知能が圧倒的な経験値を持っているからだ」と山本氏は語る。

 そして、面白いことが起きた。「強くなるだけでなく、湯水のごとく新戦法が生まれてきた。現在では、プロ棋士たちはコンピュータから勉強する時代になっている(山本氏)」。

AIが新たな戦法を生み出すようになった
AIが新たな戦法を生み出すようになった

人工知能の黒魔術化が進行している

 山本氏は「ディープラーニングは、ものすごく強力な技術だ。もはや、人工知能の代名詞になっている。ディープラーニングが得意なものは、音声や画像の認識だ。画像の認識については特に進化した。10年前は、たこと花瓶かわからないほどだった。もはや画像の認識(一般物体認識問題)は、人間の能力すら上回っている」と説明する。

 Google傘下のDeepMind社によって作られた「AlphaGo」は、既存の囲碁プログラムに対して勝率99%となった。そして、プロ囲碁棋士イ・セドル氏に4勝1敗で勝利した。

 AlphaGoは囲碁板を画像だと捉えてディープラーニングで学習することによって強くなったと山本氏は語る。「囲碁板は黒と白の画像として捉えやすい。ディープラーニングによって初めて囲碁板を計算可能な問題にすることができた。そうなれば、コンピュータの領域であっという間に強くなる。おそらくAlphaGoは、もはや人類が理解できるよりもはるか上のレベルに到達している」(山本氏)。

 山本氏は、これを将棋でもやってみたいと考えて試してみたが、将棋では場面によって可能な手がダイナミックに変化するため難しかったという。「将棋のルールはプログラムに書くと1000行ぐらいかかり、少し複雑だ。ディープラーニングにどうやってルールを教えていいのか、最初はわからなかった。そこで単純に5億局面ぐらい用意し、学習させた。それだけ読ませると良い手が打てるようになり、ルール通りの手が入ってくるようになった。かなりの衝撃を受けた。つまり、子どもが勝手にルールを獲得していくようなことが起こった。なぜこのようなことが起きたのかわからない。業界ではよく“黒魔術”と呼んでいるが、今の人工知能は黒魔術化が進行している」(山本氏)。

ディープラーニングによりルールの自動習得が起きた
ディープラーニングによりルールの自動習得が起きた

 山本氏は、“よくわからないけどうまくいく”というのは「深刻な問題だ」と語る。「例えば、自動運転の領域では深刻だ。よくわからないけど事故っちゃいました、ということが普通に起こってしまう。今後どうすればいいかという議論が起きると思う」と問題提起した。

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]