ディープラーニングがもたらす横方向の格差拡大

グーグルのAlphaGOという囲碁ソフトがトッププロに2連勝したことで、衝撃が走っている。

私は、囲碁については何も知らないし、ディープラーニングなどのAIの技術についても野次馬的に見ているだけだが、いくつか思うことがあるので書いてみる。

AIは人間を上回るのか？

私は、AIについては単なる野次馬だが、年季が入った野次馬である。80年代から結構その手の本は読んできた。今となっては、書いてあったことはほとんど覚えていないが、ひとつだけ印象に残っているのは、昔の研究者がやたら強気だったことだ。

「2001年宇宙の旅」には、HAL9000というAIだけではなくて、iPadのようなものも出てくる。あれは本当にiPadによく似ていて、年代はずれてしまったが未来予測としてはよくできていると思う。それなのになぜAIだけやたら先走っていて、実際よりずっと賢いものになってしまったのかといえば、おそらく取材した当時の研究者があれくらいのものが楽にできると大言壮語していたからだろう。

私が読んだ本にもそういうことがいっぱい書いてあった。

今から思えば笑い話で、ハードはファミコン以下だし、ソフトも単純な文字列や論理計算がようやくできた時代で、なんでそこまで強気だったのかが謎。

私が思うのは、人工知能の研究者は、人工知能やコンピュータには詳しいが、人間のことがわかってなかった。人間の頭が論理処理で動いているのは、ごく一部の例外的な状況だけなのだが、それに気がついてなかった。専門家に「あなたがやっていることをルールとして記述してください」というと、「いいよ、簡単なことだ、まず普通はそれがAかBに注目する。そして、Aならこうする、Bの時はちょっとややこしくて、CとDを比較して違いがなければEにも目をつける」みたいに、一見論理的なことを言う。実際、本人も自分がその論理で動いていると思っている。

でも本当は、そこでAとかBとか言っていることが定義や境界が曖昧で、簡単にコンピュータには理解させられない概念であることがほとんどだ。それに、こういうルールにはものすごくたくさんの例外があって、その例外をルールとして記述しようとすると、その例外ルール同士が矛盾している。だから、優先順位を定義しなくてはならないのだが、その優先順位の定義が、本題に負けないくらい複雑で難解な問題になってくる。

こういうことは実際にやってみないとわからないので、実際にやってない70年代のAI研究者はやたら強気で、その後の90年代以降の研究者は、そういう失敗をたくさん見てきたので、いっぺんで弱気になった。

ディープラーニングは、当時のAIの弱点を克服していることは間違いないと思う。昔のAIはAとかBを定義するのはプログラマにまかせていてそこがネックになっていたが、ディープラーニングは、何がAであるかBであるかを自分で学習する。

しかも、AlphaGOの対局の感想を見ていると、人間の語彙にない概念を使って盤面を評価しているようで、コンピュータの打つ手が人間のトッププロにもなかなか説明できないようだ。人間がこれまで気が付かなかった「Fの時は」とか「Gの場合は」という思考をコンピュータがしているように見える。

だが、再び強気に戻りつつある研究者は同じ間違いをしていると私は思う。

ディープラーニングが人間の頭の中で起こることのある側面をうまくシミュレートしていることは間違いないが、それが人間の知的活動の中でどれくらいの割合になるのかはやってみなければわからない。

むしろ、数値計算と論理計算とディープラーニングができるようになることで、「人間の中にそれ以外のものがあった」ということが発見されるのではないかと予想する。もちろん「それ以外」は文系的な概念としては山ほどあるのだが、もうちょっと明確な理系的な概念として何か大きな発見につながるのではないだろうか。

だから、「ディープラーニングはちまたで言われているほど大したものではない」というのが第一に言いたいこと。

AIは社会を変えるのか？

ただ、大言壮語した昔のAIが意味なかったのかといえば、そんなことはなくて、それどころ、今自分のしている商売は、ほとんどそのひとたちのおかげだと思っている。

今自分のしていることは、ネット上でのサービスの開発、運用だが、今使われている言語や技術は、大雑把にいえば、Lispの子孫だ。つまり、70年代のヘボAIのために作られたプログラミング言語やコンピュータの技術は、AIでなくWebの中で使われている。

人間の言語でなくて、プログラミング言語で書かれたプログラムをASTとして処理するなんていうことが普通に行われていて、これは昔の人が「この技術を使えば、５年でHAL9000ができるよ」言っていた技術だ。

こういうことは、数値計算のためにコンピュータを使っているだけではなかなか思いつかない。

そして、70年代の予想でもう一つずれていたことは、「相当賢いAIを作らなけらば、コンピュータが一般の人も含めた社会全体へのインパクトを持つことはない」ということで、実際には、パケット通信網という地味な技術が世の中を変えた。

昔の漫画のコンピュータは、たいてい巨大なビルの奥に鎮座した筐体になっている。しかし、実際に世の中を変えたコンピュータは我々のポケットの中に入るスマホだ。

問題は、賢いか賢くないかではなくて、スケールするかしないかだ。

ディープラーニングは、言われているほど賢いものは作れないが、スケールするものは作れる。

スケールとするとは、ここでは「急激に安くなって最終的には電卓並の値段で百均で売られる」くらいに思っておいてください。

ディープラーニングは、学習させる時には、膨大なコンピュータパワーを消費するが、その学習結果を適用する時には、そこまではいかない。だから、将来の囲碁ソフトは、電卓のようになって、クラウドから学習結果をダウンロードして動くだろう。

ディープラーニングはHAL9000やスカイネットではなく、スマホが進化したものとして想像しなければならない。それが世の中を変えるだろう。

AIの開発競争はどこで起こる？

私は、ディープラーニングをちょっとかじってみてムズカシすぎてすぐに諦めたが、じきに私にも手が届く簡単に使えるライブラリやサービスになると思っている。

そうなったら、猛烈な開発競争が起こるだろう。

AlphaGoの成果でもう一つ印象的なことは、進化の速度だ。去年最初にプロと対戦したバージョンは、今よりはるかに弱くて、３００位だかのプロにようやっと勝つレベルだったそうだ。

これは結構本質的なことで、ディープラーニングは、詳しいことを教えなくても勝手に自分で勉強してやり方を覚えるというが、その学習のための環境を人間がお膳立てする必要がある。その段階に行くまでが難しい。

コンピュータが自分で学習できるようになれば、あとはマシンを回していくだけでどんどん賢くなるが、その前の段階が難しい。

たとえば、コンピュータに野球の監督をやらせることを考えると、選手のデータを学習させることは簡単で、「打率」とか「防御率」のような概念で今まで人間が使ってない概念で勝敗に関連するものを勝手に見つけて活用するようなことまではすぐやるだろう。しかし、選手の今日のコンディションをどうやって入力したらいいのか、脈拍や血圧を測定するか顔色を画像として読み込ませるか、何か会話してその声色で判断するか。あるいは、選手の出身地や血液型や星座を入力するかしないかいっそのことDNAをぶちこんでみるか、それから観客の様子を画像や音声で入力するか天気予報と連動させるかどうか。

そういうたくさんの選択肢がある中で、難しいのは、ダメな監督だったのが辛抱強く使っているとある日突然野村さんをはるかに凌駕する名監督になることだ。

コンピュータを野村監督にするための入力データや設定が見つかってしまえば、あとは、マシンの計算パワーだけの勝負になるのだが、その前の判断が難しいところに開発競争が起こるだろう。

そして、コンピュータが結果を出すまでは、野球に詳しい人にもAIに詳しい人にもこれがうまくいくのか行かないのかなかなかわからない。

AlphaGoの場合は、モンテカルロ法＋ディープラーニングと言われているが、重要なのはモンテカルロ法のチューニングやプログラミング技術の細かい所にあると思う。これがうまくできていたから自己対戦による学習が効果的に作用して、急速に強くなった。

問題は、その一番重要なモンテカルロ法のチューニングに成功した段階では、そのソフトはまだ相当弱いということだ。結果から見ると、そのソフトは、世界レベルのトッププロに勝つ将来が約束されていて、障害はほとんどないのだが、それは事前にはわからない。

これから、「自分の作ったディープラーニングは、囲碁で言えば、2015年前半のAlphaGOの段階まで達している」と主張する詐欺師がたくさん出てくる。いや詐欺師ではなくて本人もそう信じているのだが、その中の誰に投資したらいいのか、誰にもわからない。

ディープラーニングで水曜日のカンパネラは作れるか？

最近、これにはまっている。

それで、ディープラーニングのことを考えるとどういうわけか、どうしてもこれがAIで作れるかを考えてしまう。

音楽のトラックはケンモチヒデフミという人が全部やっているそうだが、これが全部過去に聞いたことのある音の組み合わせのようでいて、どれも非常に質が高い。全部マックで作っているようだし、こういう音楽はいかにもAIが得意な分野のように思えるが、順列組み合わせだけでできているようで、細かいところに非常に神経が使ってある音楽のようにも感じる。

歌詞は、いかにもデタラメなようで、実は、「民話の桃太郎＋ゲームおたく」とか「ジャンヌダルク＋バスガイド」のような異質の概念を二つ組み合わせて、あとは連想ゲームとリズムと押韻だけでできているようで、これはディープラーニングを使うまでもなくコンピュータでできそうな気もする。

おそらく、ケンモチヒデフミさん本人がチューニングしたディープラーニングなら、同じレベルのものを作れるだろう。

しかし、ケンモチヒデフミ必須では、ディープラーニングを使う意味がないじゃないかと言うと、そうではなくて、コンピュータ化できれば今と同じレベルのものを即興で作れる。

打ち込みの音楽に即興の要素をプラスすることができるとしたら、いつどこで何をするのか予想できないコムアイのこういう個性がもっと生きるだろう。

それで、結論としては、RPGツクールのような「水曜日のカンパネラツクール」はできるだろうが、彼らが同じものを（もうちょっとだけ金かけて）使えば、彼らはそれよりずっと先を行くだろう、ということだ。

結論

それで、結論としては、ディープラーニングによってスカイネットではなく水曜日のカンパネラのような未来がやってくるという話。これからいろんなところで多くの革命が起こるのだが、それがいつどこでどのように起こるのか予想するのは難しい。その困難さが勃興期だからではなくて当分続く本質的なものであること。

つまり、心配すべきなのは、コンピュータによる専制ではなくて、格差拡大だ。ただし、格差は縦方向ではなく横方向に拡大するということ。「横方向の格差拡大」とは何か、自分でもハッキリとはわかってないのだが、潜在的にコムアイのような人が全員自分によく合ったプロデューサーに出会えるようになってそのプロデュース業がディープラーニングによって効率化されているというふうに考えたら、少しイメージできた。