SOLUTIONS

SENTIMENT ANALYSIS

センチメント分析とは—— 1990年頃からインターネットの商用利用が急速に進み、その利用者が急速に増えていきました。そうして、TVや新聞、雑誌、知人との会話だけでなく、インターネットが人々の重要な情報源・コミュニケーションの場となりました。その結果、ネット上の声が、購入する商品・サービスや投票する政党の選択に大きく影響するようになったのです。
 そこで、2000年代にはsentiment analysis(センチメント分析)やopinion miningという用語が登場し、ネットに溢れる声を自然言語処理で分析しようとする試みが盛んになりました。つまり、膨大なテキストに含まれる意見を自動で判別しようということです。ただ、その手法は、感情を表す単語の出現の仕方に着目したもので、商品や個別の性能に対する評価をポジティブ-ネガティブの軸で解析するものでした。
 ところで、2010年代前半から機械学習の中で深層学習のパフォーマンスの良さが際立ってきました。自然言語処理の分野でも深層学習が重要性を増していき、2010年代後半にはセンチメント分析にも深層学習が導入されました。書かれた内容がどんな感情(ポジティブ-ネガティブや喜び・怒りなどの基本感情)を表しているかを人間が判断したデータをたくさん作って機械に深層学習をさせると、学習していない内容に対しても機械が感情を推論できるようになります。なぜそう判断したのかはブラックボックスですが、推定精度は高くなります。
 京都テキストラボの技術も深層学習によるセンチメント分析の流れに連なるものです。自然言語処理の研究者の指揮の下で、最適な手法を使って高精度な深層学習モデルを構築しています。でも、私たちが目指すのは、ネット上の評価の正確な把握にとどまりません。心理学の感情研究の研究者が学習データの設計を行うことで、これまでになく自由で、かつ学術的な裏づけのしっかりとしたセンチメント分析を実現しました。