本文へ移動します

ミニ講義 ― 首都大学東京の「学び」を体験!
小町 守 准教授

小町 守 准教授
H30再編後の所属
システムデザイン学部 情報科学科
小町 守 准教授 【教員紹介】
キーワード:
自然言語処理, ディープラーニング, 人工知能(AI)

コンピュータは自ら学習する時代! でも苦手分野もある!

イメージ1
AI開発にも関連する自然言語処理とは?

人間の言葉をコンピュータに理解させたり、処理させたりする技術を「自然言語処理」と言います。言語学的側面を強調して「計算言語学」と呼ばれることもあります。自然言語処理は、データの入出力にテキスト(文字データ)が関係する、あらゆる領域で使用される技術であり、身近な例で言えば、機械翻訳や日本語入力、検索エンジンなどに応用されています。

コンピュータが自分で学習する?

1980年代くらいまでは、コンピュータに人間の言葉を学習させるには、まず人間が、どの単語が主語になり、どの単語が述語になるかなどのルールを手作業で記述し、基礎となる知識をコンピュータに与える必要がありました。しかし、90年代以降はコンピュータが人間の作ったテキストから自動的にルールを抽出することができるようになりました。これを機械学習「マシンラーニング」と言います。
インターネットの普及により、ウェブ上に大量のテキストが公開されるようになってからは、それらの膨大なデータを使ってより効率的な機械学習が可能になりました。また、深層学習「ディープラーニング」と呼ばれる大規模かつ高精度な学習も可能になり、注目を集めています。Googleの開発したAlphaGoと呼ばれるコンピュータ囲碁は2016年に世界チャンピオンを破りましたが、深層学習の上にコンピュータ同士を対局させる強化学習と呼ばれる手法を用いています。

コンピュータの意外な苦手分野とは?

コンピュータの言語処理能力は機械学習により飛躍的に向上しました。しかし、いまだに不得意な分野もあります。それは、文章の前後の関係性や、単語の背景知識などの「文脈を理解すること」です。
例えば、日本語の日常会話では、主語が省略されることがよくあります。人間なら文脈から主語が誰か、あるいは何かを判断することができますが、コンピュータにはその判断が難しいのです。コンピュータに文脈を理解させることは、自然言語処理の分野におけるこれからの重要な課題と言えます。

コンピュータの画像認識能力は、人間の能力を超えた?

イメージ1
何の画像かをコンピュータが言い当てる

人間の言葉をコンピュータに理解させたり、処理させたりする技術を「自然言語処理」と言います。それは、機械翻訳や検索エンジン、日本語入力、文書要約など、データの入出力にテキスト(文字データ)が関係する、あらゆる領域で使用されています。また、AI(人工知能)開発とも関連する分野です。
例えば、翻訳の場合は入力も出力もテキストですが、画像を認識してその内容に合ったテキストを出力する、つまり「何についての画像かを言語化する」技術も自然言語処理の一種です。この場合、画像を入力すると、テキストが出力されます。自然言語処理は、入出力のどちらかにテキストが関わっている時には必ず用いられる技術なのです。

コンピュータは苦手を克服した?

これまで画像認識はコンピュータにとって苦手分野でしたが、コンピュータが自ら学習する機械学習「マシンラーニング」が可能になったり、計算処理速度が上がったり、扱えるデータ量が大幅に増えたりなどの技術革新を経て、次第にその精度が上がっていきました。特に、生物の神経回路を模倣したニューラルネットワークを発展させた「深層学習(ディープラーニング)」が可能になってからは、コンピュータの画像認識能力が飛躍的に伸びています。2015年には、写真に写されたものを当てる問題で、人間の成績を超えることに成功したというデータもあります。

関係性がわからない?

コンピュータは画像内のオブジェクト(対象)を認識することは得意になりましたが、その画像から読み取れる状況、すなわちオブジェクト同士の関係性を認識することはまだあまり得意ではありません。
例えば、少年が犬とボールで遊んでいる画像を認識させたとしても、「少年」「犬」「ボール」といった各オブジェクトを正確に認識することはできますが、それらが何をしているか、各オブジェクトがどんな関係にあるのかを認識するのは苦手なのです。また、連続した画像である動画を認識することもまだまだ不得意であり、今後の課題と言えます。

高校生・受験生の皆さんへのメッセージ

私は文系の学部から理系の大学院に進学し、両方の分野を経験しました。その上で必要な知識を振り返ると、必須スキルは「読み、書き、そろばん」ではなく「英語、数学、プログラミング」です。理系分野は文系以上に英語が国際語で、実際に仕事で英語をバリバリ使うのは文系ではなく理系です。文系分野は数学の知識の有無で統計的な嘘にだまされるかに決定的な差がつきます。どちらの分野でも、繰り返し作業をしたり漏れなく処理したりするにはプログラミングが必須です。これらのスキルを身につけて、大きく活躍してください。


夢ナビ編集部監修

ページトップへ