日本語BERTで音声Chatbot

Googleの最新のDeepLearningによる自然言語処理技術BERTの日本語対応が進んでいる。
PyTorch版はhuggingface/transformersで活発に移植、開発されている。
日本語BERTをEncoderとするChatbotの作成方法がGithubに挙がっていたので、これを参考にして
テキスト入力された質問を、日本語音声で回答するChatbotを作ってみた。
日本語音声は以前作った、Wavenetによる日本語音声の生成を活用している。

 

BERTの最大の特徴は、AIの処理によって文章や対話の文脈を理解してるなと思わせるところ。
勿論、実際には理解してるのではなく、文章の前後を含めての相関性をうまく捉えることができるようなアルゴリズムに依る。
BERTは事前学習モデルなので、更に独自のデータで追加学習して、モデルを特化できる。
@reppy4620さんのモデルではツイッターのデータを収集して、対話に向いたモデルになるように学習してるみたい。
今回、更に通常の硬めの文章を2000行ほど追加学習させた。
どうも、"親の顔を見てみたい"、と思うようなAIだが、会話のレスポンスはほとんどリアルタイム。
結果は以下の通り。

音声付きはこれ

こんにちわ

今日は天気がいいですね

どうしたの、なにか変ですね

マレーシ旅行に行きたい

マレー旅行したい

 一緒に、行きますか

一緒に、行きたいですか

 嬉しい

ところで、何歳ですか

へー、ずいぶん若いんですね

住まいはどこですか

生まれはどこですか

私は犬が好きです

私は猫は嫌いです

どうしたの

 

コメント powered by CComment