囲碁の最強人工知能 AlphaGo(アルファ碁)の仕組みとは?

TECH::NOTE(テックノート)は、未経験から最先端のテクノロジー人材へTECH::CAMP(テックキャンプ)、10週間でエンジニア転職実現までサポートを行うTECH::EXPERT(テックエキスパート)、これらのサービスを運営する株式会社divのオウンドメディアです。

2017年5月27日、人類最強の呼び声が高い棋士・柯潔(カ・ケツ)にグーグル社傘下のイギリスの人工知能企業ディープマインド社が開発する囲碁AI・AlphaGo(アルファ碁)が勝利しました。

AlphaGoを相手に苦悶の表情を浮かべる柯潔。出典:The Future of Go Summit, Match Three: Ke Jie & AlphaGo

27日の対局に先立ち23日、25日にもAlphaGoは柯潔を相手に勝利し、柯潔は人工知能を相手にまさかの全敗を喫したのです。
囲碁は元々、AI(人工知能)にとってもっとも難しいゲームの1つとされていました。

最強棋士を破る囲碁AIは、どのようにして生まれたのでしょうか?

今回はAlphaGoについて、詳しくご紹介します。

AlphaGo(アルファ碁)とは?

AlphaGo(アルファ碁)はいま、非常に注目されているAI(人工知能)です。AlphaGoの歴史や開発の裏側をご紹介します。

DeepMind社が開発した碁の人工知能(AI)

AlphaGoは、ハンディキャップ無しでプロ棋士を破った囲碁AI(人工知能)です。

2015年10月、碁のヨーロッパ王者であるファン・フイ2段に5戦5勝を収め、続く2016年3月には、21年間のプロキャリアで18回に渡って世界王者になった経歴を持つイ・セドル9段に4勝1敗で勝利しました。

AlphaGoとイ・セドル9段の第1回の対局の模様は、DeepMind社によってストリーミング配信されました。

ファン・フイ2段は、AlphaGoの圧倒的な強さについて「まるで壁のようだ」と述べています。

Losing was very hard. Before I played with AlphaGo, I thought I would win. After the first game I changed my strategy and fought more, but I lost. The problem is humans sometimes make very big mistakes, because we are human. Sometimes we are tired, sometimes we so want to win the game, we have this pressure. The programme is not like this. It’s very strong and stable, it seems like a wall. For me this is a big difference. I know AlphaGo is a computer, but if no one told me, maybe I would think the player was a little strange, but a very strong player, a real person.

敗北はとてもハードなことだった。アルファ碁と対局する前は、僕は「きっと勝てるだろう」と考えていた。最初の対局の後には戦術を変えて挑んだけれど、それでも負けてしまった。人間には時に大きなミスをするという問題がある。なぜなら、僕たちは人間だからだ。時には僕たちは疲れているし、時には「何が何でもゲームに勝ちたい」と望んで、大きなプレッシャーを感じる。でも、プログラムはそうじゃない。まるで壁のようにプログラムはとても強く、安定している。この違いは、僕にとってはとても大きなものなんだ。
僕はアルファ碁がコンピューターであることを元々知っていたけれど、もしも誰一人としてその事実を僕に伝えていなかったら、僕は対局相手のことを少々奇妙だがとても強い本物の人間のプレイヤーだと感じただろうね。

出典:Go players react to computer defeat(日本語訳は筆者拙訳)

碁はAIにとって最も難しいゲームと見なされてきた

元来、碁はAI(人工知能)にとって、最も難しいゲームの1つだと見なされていました。

AlphaGoのプログラムに関する論文『Mastering the Game of Go with Deep Neural Networks and Tree Search』の書き出しは以下の通りです。

The game of Go has long been viewed as the most challenging of classic games for artificial intelligence due to its enormous search space and the difficulty of evaluating board positions and moves.

碁は長い間その探索範囲の膨大さと、盤面のポジションと動きの評価の難しさからAI(人工知能)にとってもっとも努力を要するクラシックゲームだとみなされていた。

出典:『Mastering the Game of Go with Deep Neural Networks and Tree Search』(日本語訳は筆者拙訳)

AIにとって最も困難なゲームに挑み、ついに世界最強レベルの棋士を破るに至ったからこそAlphaGoは世界中に衝撃を与えたのです。

AlphaGoの論文には何が書かれているのか

AlphaGoの論文によればAlphaGoは盤面を評価するのに「value networks」、そして動きを選択するために「policy networks」という2つの人工知能に用いる評価関数をコンピュータ囲碁の新たなアプローチとして使っているとのことです。

これらのディープニューラルネットワークは人間の囲碁のプロによる教師あり学習と、自己対戦による強化学習を行っており、その組み合わせにより囲碁の学習が進んでいくそうです。

TECH::CAMPでは2017年10月12日より、AIカリキュラムが始まります!
テクノロジースクール TECH::CAMPでは2017年10月12日より、AI(人工知能)カリキュラムを開講します。
こちらの記事ではAI(人工知能)の歴史と機械学習、ディープラーニングの最新事例をご紹介しています。
是非、併せてお読みください。
・AI(人工知能)とは?AIの歴史と機械学習、ディープラーニングの最新事例を紹介

AlphaGoの論文の要約

以下のサイトでは、AlphaGoの論文の内容が分かりやすくまとめられ、紹介されています。論文の内容が気になる方は、ぜひご覧ください。

  • Googleが出した囲碁ソフト「AlphaGo」の論文を翻訳して解説してみる。

http://7rpn.hatenablog.com/entry/2016/06/10/192357

  • AlphaGoの仕組み

人類最強棋士・柯潔を破ったAlphaGo

柯潔(カ・ケツ)に対し、AlphaGoは3戦3勝の成績を収めました。まさに完勝だったと言えるでしょう。

柯潔は対局後に号泣

AlphaGoとの対局中、柯潔は10分近くの離席をしています。そして席に戻ってきた後、1時間近く対局を続け投了しました。

東亜日報は「アルファ碁と碁を打つのは苦しかった。アルファ碁と碁を打つ時、勝てるという希望を全く持つことができなかった」という柯潔の発言を、ウェブサイトで伝えています。

また柯潔の父親のインタビューによると、彼は対局終了後、トイレに駆け込んで泣いていたとのことです。

AlphaGo vs AlphaGoの対局で強化学習が行われる

AlphaGoはAlphaGo同士の対局による強化学習を行っています。

DeepMind社サイトで棋譜が公開中

ディープマインド社のサイトに公開されている棋譜の一部(スクリーンショット)

 

ディープマインド社のサイトでは、AlphaGo vs AlphaGoの対極の棋譜が50局分公開されています。

世界最強の囲碁AIの自己対戦を記録した棋譜は囲碁AIの研究者にとっても、囲碁の棋士にとっても非常に貴重な資料です。

AlphaGoを生み出したディープラーニングの可能性とは

AlphaGoの強さを支えているのが、ディープラーニングというAI(人工知能)の技術です。

ディープラーニングはいまや囲碁だけでなく、幅広い領域で活用され始めています。

ディープラーニングでアニメ風の女の子を自動生成

MakeGirlsMoeにて、ディープラーニングで自動生成されたイラスト

MakeGirlsMoeは京都大学の留学生・金陽華さん(Jin Yanghua)とその友人ら6人によって開発された、ディープラーニングを活用し、ユーザーの好みに合わせたアニメ風の女の子のイラストを生成するウェブサービスです。

例えば「ヘアカラーは赤、髪の長さはロング、目の色は緑。口は閉じている方が良い」といった条件を入力すると、その条件に沿ったイラストがAIによって生成されます。全ての条件をランダムにすることも可能です。

MakeGirlsMoeのサイト画面。各条件を入力して「Generate」をクリックすると画像が生成されます。

ディープラーニングでSiriの発音が滑らかに

iOSに搭載されている音声アシスタント・Siriの滑舌の改善にも、ディープラーニングが活用されています。
Appleが公開した資料「Deep Learning for Siri’s Voice」ではAppleがどのようにディープラーニングを活用し、Siriのボイスを改善したかが詳細に明かされています。

「Deep Learning for Siri’s Voice」に公開されている、各国の男女によるリスニングテストの結果。iOS9に比べ、iOS10のSiriの性能が向上していることが示されています。

研究結果のページでは、iOS9・iOS10・iOS11のSiriの文章読み上げの性能をそれぞれ比較することができます。

バージョンが上がるごとに、Siriの発音が改善されていることが分かります。

アルファ碁ゼロの登場(2017年10月20日付)

既に人類最強の棋士・柯潔(カ・ケツ)を破ったアルファ碁。名実ともに「最強」の称号を手に入れましたが、その進化は更に続いています。

2017年10月19日、ディープマインド社は「アルファ碁ゼロ」を発表しました。このアルファ碁ゼロ、以前のアルファ碁に対し100戦全勝をおさめているそうです。

新旧アルファ碁の最大の違いは、「AIによる独自学習」。

これまでは人間の棋譜をAIに読み込ませていたため、アルファ碁の強さは人間の知見の延長に過ぎませんでした。しかし、アルファ碁ゼロが教わったのは囲碁のルールだけ。その後はAI同士の対局で独自の成長を遂げ、最強の打ち方を編み出したのです。

人間の発想にとらわれないAIの登場は、今後様々な産業における新発見につながるかもしれません。

さいごに

AlphaGoは、AI(人工知能)にとって最も困難とされていたゲーム・囲碁で人類最強の棋士に3戦3勝という圧倒的な成果を収めました。

AlphaGoが採用したディープラーニングの技術は、幅広い分野に導入され始めています。

いまあなたが担当している仕事を、AIが代替するようになるまでにそう長い時間は掛からないかもしれません。

AIのリテラシーを身につけ、AIとの向き合い方を考えるのは現代人にとって必須のことではないでしょうか。

絶対に挫折しないテクノロジー体験会で
最新のプログラミングを学ぼう

プログラミング体験会

TECH::CAMP』のプログラミング体験会なら、Webや人工知能、VRといった最新テクノロジーを無料で学べます。教室で講師に質問し放題なので、全くの未経験からでも絶対に挫折せずにやり切れます。

  • 実際にプログラミングを触れる
  • 質問し放題なので、疑問点が即解消される
  • テクノロジーをなぜ学ぶべきなのか明確になる
  • 人工知能やVRなど他では学べないテクノロジーが学べる

まずは一度プログラミングに触れてみたい方は気軽にご参加ください。なお月に1000名以上が参加するため、予約はお早めをオススメしております。

プログラミング体験会を詳しく見る

Kazuto Seki Kazuto Seki
音楽ライターとしてエイベックス、ビクター、トイズファクトリー等に所属するアーティストの取材を担当。2016年に開催された『Bjork Digital』の取材経験から、VR×音楽に関心を抱く。2017年よりテクノロジーに関するライティングを開始し、TECH::NOTEにジョイン。猫とウサギを飼っています。
  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

SNSでもご購読できます。

  • カテゴリー
  • このエントリーをはてなブックマークに追加
    記事をシェア→