フォーラム詳細

  • 解決済み
    #ID:48
    「腕組み」という音声の認識がうまくされません。
  • 投稿者:おさむ
    投稿日:2018年11月06日

    「腕組み」という言葉を認識させたいのですが、
    辞書を使わずに話しかけると、「MEGUMI」「恵」のように認識されます。

    このためユーザー辞書に設定すると、今度は「恵」「果汁グミ」などで話しても「腕組み」と認識されます。

    何か改善方法はありますでしょうか。

    追記
    ユーザー辞書 → ローカル辞書の間違い でした。
このトピックに返信するにはログインが必要です。
8件の返信を表示中
#ID:129

回答者:ユニロボット
回答日:2018年11月06日

おさむ様

お世話になっております。

>「腕組み」という言葉を認識させたいのですが、辞書を使わずに話しかけると、「MEGUMI」「恵」のように認識されます。
>このためユーザー辞書に設定すると、今度は「恵」「果汁グミ」などで話しても「腕組み」と認識されます。

ユーザー辞書とおっしゃっているのは、ローカル辞書のことをさしていますでしょうか?
なお、ローカル辞書の場合は、登録した辞書の言葉に発話内容を寄せてしまうので、例えば「ウデグミ」とだけ登録した場合は、全ての言葉を「腕組み」として認識します。
ローカル辞書の使い方としては、複数の言葉の中からある言葉を選択してもらうようなケースが有効です。

どのようなシーンで「腕組み」という発話を取得したいかにもよりますが、「聞く」ノードでトリガーとして取得したい場合は、「恵」や「果汁グミ」なども候補として入れてください。
他にも、誤認識しやすい単語があれば、それも「腕組み」というコマンドとして複数登録してください。

もし、意図した回答になっていない場合は、その旨教えてください。
よろしくお願いいたします。
#ID:130
回答者:おさむ
回答日:2018年11月06日

返信ありがとうございます。

ローカル辞書の間違いでした。

クイズを作っており、答えとして腕組みを認識させたいと思っています。

MEGUMIなども複数登録しましたが、
やはり腕組みにも寄せられるので、間違っていても「正解」になってしまいます。
#ID:131

回答者:ユニロボット
回答日:2018年11月06日

おさむ様

返答ノードで回答を取るということで、ローカル辞書を活用されているのですね。
参考までに、ローカル辞書の内容を教えていただけると、こちらでも確認してみます。

ご検討ください。
#ID:132
回答者:おさむ
回答日:2018年11月07日

お世話になります。辞書データを掲載します。

[
{"title": "腕組み", "pronunciation": "ウデグミ"},
{"title": "恵", "pronunciation": "メグミ"},
{"title": "果汁グミ", "pronunciation": "カジュウグミ"}
]

腕組みだけ認識されて、正解となって欲しい状況です。
なお、リプライの候補に入った場合も正解としているので
候補1や候補2にも違う言葉の場合は「腕組み」と入らないで欲しいと思っています。
#ID:136

回答者:ユニロボット
回答日:2018年11月07日

おさむ様

サンプルのご提供ありがとうございます。

一度こちらでも状況を確認してみます。
また状況把握でき次第、ご回答いたします。
#ID:137

回答者:ユニロボット
回答日:2018年11月07日

おさむ様

辞書データをこちらでも実際に試してみました。

結果から申しますと、ローカル辞書に登録している単語が、この3つでかつそれぞれ誤認識しやすい単語であることから「腕組み」だけを抽出することは非常に難しいです。本来、ローカル辞書は、想定された定型単語が複数ある中で、ある程度強引にその中の一つに認識結果を寄せることができるというもので、似ている言葉を分離することは不得意です。

おそらくクイズでの答えはユニークな回答が得られることから、事前にどのような発話があるかを予想し、ローカル辞書を作成しておくことは難しいのかなと考えられます。この為、本ケースでは、ローカル辞書ではなく、「腕組み」と発話した際に誤認識された単語(「恵」「果汁グミ」など)は「腕組み」と発話されたという風に言葉の揺れを吸収する仕組みが必要ではないかと思います。

なお、skillcreatorには上記のような言葉の揺れを吸収する仕組みは特にありません。また、私の環境(静かなところ)では「腕組」「腕組み」と認識されていることを考えると、環境によって認識結果は違いますので、「恵」や「果汁グミ」以外の言葉の揺れは存在する可能性もあります。
#ID:138
回答者:おさむ
回答日:2018年11月08日

私の環境は音楽をかけて話しておりました。
静かな環境にしたところ、認識精度があがり腕組みと認識されています。

法人モデルを小売店で利用することを想定しているため
実際の環境では常時大きめの音楽がかかっていることになります。
ローカル辞書では難しいとのことですので、
ご認識が増えた場合は、認識しやすい言葉にかえていくことで対応する予定です。

対応いただきありがとうございました。
#ID:139

回答者:ユニロボット
回答日:2018年11月08日

おさむ様

お世話になっております。

環境に応じてご対応されるとのことで、承知いたしました。
今後とも何卒よろしくお願いいたします。