2018年6月25日月曜日

会話文のテキストを対象とした感情分析・感情分類ライブラリや辞書の選択肢

前提・実現したいこと
会話文のテキスト(1メッセージ:20文字*3行)に対して感情分析を行い、
1メッセージ毎に「怒り」「悲しみ」「笑い」といった10程度の感情パターンに分類する方法について

幾つか試してみましたが、想定より手間がかかりそうだったので、
これ試してみると良いよとか可能そうな選択肢をご存知の方が居れば教えて頂けたらなと思います

試したこと・発生している問題
1.IBM_WatsonのTone_Analizerを用いる方法
->分類パターンが喜び、怒り、不安、悲しみ、嫌悪という負のパターンに偏ってしまっているが、
->対象テキストでは喜び、期待、真剣、恥じらい等、正の感情を含む文章が多いため断念

2.Google_Cloud_Platformの感情分析APIを利用する方法
->出力された数値がそのままでは想定通りの分類ができず、
->分類のための評価関数を作成する必要がありそうだった

3.Mecab + ML_Askを用いる方法
->分類カテゴリの数に関しては丁度良く文句なし
->ただ分類に使用されている辞書を見る限りおそらく対象が会話文ではないため
->10メッセージ中2メッセージほどしか分類できなかった
->対象の会話文テキストに対して辞書をチューニング(ほぼ作成に近い)をする必要がある

https://teratail.com/questions/102154

0 件のコメント:

コメントを投稿