自然言語処理(NLP)でできることとは？【入門者向け】

2019年2月15日 2019年2月15日

siny

1 自然言語処理とは？
2 そもそも言語（言葉）ってなんぞや？
3 シンボル・グラウンディング問題とは？
4 自然言語処理でできることは？
5 自然言語処理で押さえておきたいポイント
- 5.1 ①形態素解析
- 5.2 ②係り受け構造解析
6 言語をコンピュータに理解させる方法は？
7 自然言語処理関連の書籍

こんにちは。sinyです。

2019年はAI分野において自然言語処理(NLP)が飛躍的に発展していく年になると思っているのですが、これからNLPにチャレンジしたいという入門者向けに自然言語処理でできること、その概要についてまとめてみました。

すこしでも参考になれば幸いです！

自然言語処理とは？

機械学習やディープラーニングの勉強を進めていくと、「自然言語処理」という言葉がよく出てきます。
自然言語処理(NLP)は「Natural Language Processing」の略で、いわゆる人間が用いる言葉のことを言います。

日本語、英語、フランス語など人が話す言語のことを自然言語（Natural Language)と言うんだね。

PythonやJavaといった言語は「プログラム言語」といい、同じ「言語」とつくけどNLPとは全く違う意味で用いられます。

そもそも言語（言葉）ってなんぞや？

最近、AIの領域でも流行りつつある自然言語処理ですが、簡単に言うと人が扱う言葉をコンピュータに理解させようという学問領域のことだといってよいと思います。

で、「そもそも言語ってなんぞや？」というところから話したいと思います。

まず、大前提として「言語」自体に意味はなく、単なる記号に過ぎないということです。
例えば以下のような例を考えてみましょう。

人が、「言語」の意味を理解できるのは、体験によってその言語（ロウソク）の意味（ロウソクは火をつけるもの/照明に使える・・・など）を理解できるようになるからであって、言語自体（ロウソク）はただの記号に過ぎないわけです。

そして、

「言語をコンピューターに理解させるにはどうしたらよいか？」

というのが、自然言語処理の難しいところです。

シンボル・グラウンディング問題とは？

ここで、押さえておきたい言語として「シンボル・グラウンディング問題」という言葉があります。

これは、「言語という意味のないものに対して、どうやって意味、概念を結びつけるか？」という問題で、この問題が解決できないと自然言語処理を実現することができないわけです。

自然言語処理でできることは？

自然言語処理を利用するといろいろなことができるようになります。

既に世の中で利用されているサービスとしては、以下のようなものがあります。

Google翻訳（英語⇒日本語へ自動翻訳など）
スマートスピーカー（アレクサなど）
チャットボット（ユーザからの質問に自動応答してくれる）
文章の自動要約

他にも様々な領域で活用できる可能性があります。

自然言語処理で押さえておきたいポイント

自然言語処理で押さえておきたいポイントを２つ挙げておきます。

①形態素解析

形態素解析（けいたいそかいせき、Morphological Analysis）とは、文法的な情報の注記の無い自然言語のテキストデータ（文）から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素（Morpheme, おおまかにいえば、言語で意味を持つ最小単位）の列に分割し、それぞれの形態素の品詞等を判別する作業である。

形態素解析（Wikipediaより引用）

ざっくり言うと、日本語の文章をあるルールに従って最小単位に分割する作業のことを形態素解析と言います。