国立人工知能先端研究センター(AIX)の先生方が著した啓蒙本。5人の教授陣が、それぞれの専門分野について書いてます。
1章:2025年がやってくる
2章:ロボットと人工知能
3章:IOTとは
4章:自然言語処理と人工知能
5章:人工知能における感性
6章:社会に浸透する汎用人工知能
現在は第3次人工知能ブームだそうです。過去の2回は「人の複雑さ」を構築できずに失敗。
今回のブームの主役は深層学習(ディープラーニング)。じつは10年前の技術。
10年前は実現できなかった。ディープラーニングという手法は燃費が悪い。当時はビッグデータを容易に利用できなかった。ここ数年GPUの性能が大幅に向上した。そのため今回はディープラーニングを実際に活用できる。
本書は2025年を見据えて描かれた本です。なぜ2025年なのか?2025年は日本の人口が700万人減る(2015年比)。団塊の世代が75歳超えの後期高齢者になる。国民の3分の1が65歳以上になる。この問題に人工知能で何ができるか?読者は考えることを強要されます。
レイ・カーツワイルはいいます。「2045年に人工知能が人類を追い抜く」。
ほんとうでしょうか?
世界的権威が綿密な計算の上でいうのだから、多分そうなんでしょう。とはいえ脳は複雑です。2000億個の神経細胞が直線にすると100万kmにもなるネットワークで、複雑にネットワーク化された超大規模複雑ネットワーク構造。
しかも各神経細胞が自律的に動作する超並列マシンです。これほどの大規模複雑なシステムをわれわれは工学的に構築できていないし、まして制御できる術をもっていない。
今回は興味のあった、自然言語処理と人工知能の進捗について読書メモを。
AIの自動翻訳で英語学習は不要になるのか?
深い意味理解が必要ない定型的な文章、特定の狭い分野に関する文章の翻訳は、2025年には実用レベルに達すると予想する。
しかし多くの文章については、あくまで翻訳は前処理としての利用にとどまる。文単位の翻訳では文章全体の自然さが確保されない、細かい訳が難しいといった問題があるので。
同時通訳で求められる正確な翻訳は、実現困難である。会話全体の内容把握や、深い意味の理解が必要なため。
いうまでもなく小説の翻訳や映画の字幕など、意訳が必要とされる翻訳も困難であり、将来的にも人手に頼らざるを得ない。
⇒国立人工知能先端研究センターの専門家の見解では、将来的にもムリですか・・
2045年シンギュラリティになると、可能になるとは思いますが。
機械翻訳の歩み
需要が大きいので、初期のころから機械翻訳は研究開発が盛んにされている。近年、対訳コーパスと呼ばれる文単位の対訳例を大量に集めたデータが利用できるようになり、これを用いた統計的機械翻訳が主流となった。
さらにここ数年は、深層学習を用いた機械翻訳に注目が集まっている。2016年にグーグル翻訳にこの技術が適用されて、大きく翻訳技術が向上した。
機械翻訳に用いられるニューラルネットワークは、系列変換モデルと呼ばれるネットワークがベースとなっている。
系列変換モデルは文を単語列と捉えて、翻訳元の言語の単語列を、翻訳先の言語の単語列に変換する手法である。
深層学習による機械翻訳の特徴は、統計的機械翻訳のように、単語列をそのまま扱うのではなく、単語列の意味を抽象化した、ベクトル表現を用いる点にある。
現状はニューラル機械翻訳の性能を向上させる、さまざまな試みが集中して研究されており、2025年までには翻訳性能の向上が十分に期待できる。
しかし現在のニューラル機械翻訳は、基本的に文単位での翻訳であるため、文脈を用いて意味のあいまいさを解消しないといけない文や文章については、まだ十分な性能が得られていない。
このような訳し分けができる機械翻訳は、今後の大きな課題として残っている。言い換えると、意味的にあいまいさを極力排除するように作成された文章では、十分な翻訳性能を達成することができる。
(補足)
「ごはん行く?」⇒Go rice って変な訳になる。
「ぼくといっしょに夕食食べに行けへん?」⇒Would you like to go out for dinner with me?
グーグル翻訳では「日本語」を正確にいうと、きっちりした「英語」になるのでしょう。
その他の人工知能による自然言語処理はどうなるのか?
①会話エージェントによる顧客対応
商品販売などの消費者サポート。コールセンターや店頭販売員が人工知能に置き換わるのは、2025年までは実現しそうにない。あくまでも人間の補助としての役割。
②さまざまな文章作成
定型化しやすい文章(契約書など)は人工知能による自動作成で代替できるようになる。
③新聞社などの報道文章作成
客観的な事実を伝達するための文章は、文章構造が定型化しやすいので、比較的短い記事の多くは、2025年までに自動作成をベースにしたものに置き換わっていく。一方で評価や解説する記事は、置き換えることは難しい。
④自動要約
文章要約。元の文章の内容を深く理解した上で何を述べるべきか考え、その内容を文章として生成する。このような文章生成は困難である。単文章要約はかなり以前から研究されているが、大量の学習データの入手が困難であることから、深層学習はあまり進展していない。
なぜアリは巣とエサの最短距離を行列できるのか?
アリはフェロモンというニオイ物質を地面につけながら歩いている。多くのアリが通った経路がフェロモンのニオイがきつくなる。そして行列ができる。
ではエサと巣との最短経路はどのように形成されるのか?その答えはフェロモンの揮発性にある。フェロモンは香水のようにだんだん匂いが消えていく。移動距離の長いルートのほうが、フェロモンが揮発して匂いが薄くなる。
ここでの重要なポイントは、個々のアリは、自分たちが最短経路を形成するための行動はしていないということ。最短距離は個々のアリの行動の総体として創発されるのだ。
フェロモンを介した間接的な協調行動により、アリ全体として最短経路を形成する。全体として個々の能力を超える高い知能が創発される仕組みのことを群知能という。
ホタルの同期点滅現象
パプアニューギニアの蛍は同期する。1本の木に何万匹がくっつき、タイミングを合わせて全個体が同期点滅する。
点滅するのはオス。繁殖期に多くのメスに気づいてもらうため、同時に光る。そのほうが明るく、遠くのメスにも気づいてもらえるという理由。同期は重要な技術であり、IOTにとっては生命線である。
パプアのホタルは、リーダーも存在しないのに同期ができる。最初はバラバラにランダム、次にウェーブになり、比較的短時間で同期的点滅に至る。
この同期現象を起こす仕掛けは、スモールワールド型のネットワークにある。数万匹のホタルの点滅は、局所的点滅のウェーブ状態にしかならないはずだが、偶然他のグループの点滅が見える個体がいて、それが反応して点滅、やがて同期に至る。
有名な「スモールワールド実験」。ぜんぜん知らない人に手紙を届けるとしたら、仲介者はだいたい6人になるという。「相手を知ってるかもしれない、あなたと親しい友人に封筒を手渡していい」というルール。北海道の鈴木さんが、全然知らない九州の山田太郎さんに手紙を渡す。たかだか友だちの友達を6人経由すると手紙は届く。どのようにつながるかというと、「ショートカット」でつながる。ショートカットとして新規に敷設したつながりは、わずか数%であっても、全体的なレベルでつながる。
我々人間の知能も、アリ型の群知能とホタル型の群知能の両方によって創発されている。人間の脳は2000億個、人体では60兆個という膨大な数の細胞で構成されている。個々の細胞は個々のアリと変わらない。しかし細胞が集まると臓器になる。人体を始めとする生物は、群知能型のシステム。
ホタルのネットワーク構造も重要な要素。脳を構成する個々の神経細胞が、他の神経細胞と大規模複雑ネットワークを形成している。この構造は、ホタルの同期創発のスモールワールド構造とおなじ。
脳は複数の部位の集合体で、互いに連携することで脳全体として機能を創発する。ホタルの同期であれば、個々の局所的なグループが大脳や小脳であり、それらがショートカットの役割を持つ神経細胞同士により互いに接続されることで、脳全体としてネットワークを構成している。