AI(人工知能/ディープラーニング)

今回のAIセミナーは画像ではなく言語がテーマ、NLPをAIで実験(全景AIセミナー5回め)

この記事は約1分で読めます。

fastainlpmemo.jpg全景AIセミナー5回めは11月7日に開催された。これまでは画像処理のテーマが多かったが、今回のテーマは「NLP(自然言語処理)」である。言語のAIというとワトソンなどのほうが頭に浮かぶが、今回の取り組みはこれまでの全景AIセミナーの流れを組んでパイソンで実施。
日本語を単語にわける「わかちがち処理」をしないで、一文字づつデータセットとして持つのが大きな特徴だった。

全景AIセミナー

今回は自然言語処理(NLP)

これで、ディープラーニングの応用を一回りしたことになる。

zenkeiai5ichiki.jpg

取り組んだテーマは、芥川龍之介の小説を青空文庫から読み取りデータセットとして学習させることで、いろんなことができることができることなどを紹介。たとえば、続きの文章を芥川龍之介が書いたらどうなるかとか、この文章は誰が書いたかを判定するとか、ブログ記事本文を読ませてタイトルを自動生成するとか、なかなかおもしろい取り組みだった。

今回の内容
01 – 青空文庫(芥川龍之介)から Language Model を作る
02 – みんなの経済新聞(金沢経済新聞)の記事から Language Model を作る
03 – みんなの経済新聞の記事を分類する
04 – みんなの経済新聞の記事からタイトルを生成する