WEBサービスを利用した対話支援RTC群の開発

WEBサービスを利用した対話支援RTC群の開発

Author: 
shimotomai

特に近年WEBのサービスとして音声認識や画像検索をはじめとした技術の利用が可能となってきています。 これによりWEB上の膨大な知識を利用することが可能となります。googleで提供するサービスのうち、音声認識や音声合成、そのほかの検索サイトによる検索サービスを利用するRTC群を開発しました。

robovie_h.jpg

仕様

  • 言語:Python
  • OS:Windows、Linux
  • RTミドルウェアPython版OpenRTM-aist 1.1.0RC1

必要ライブラリ

コンポーネント群

音声処理

  • googleサービス音声システム 詳細
    • gSpeech:  google apiを利用した音声合成 (zip)
    • gRecognizer:  google apiを利用した音声認識 (zip)
    • mp3decoder:  mp3入力をraw音声に変換。音声合成gSpeechの出力(mp3)から音声データに変換 (zip)
    • gJsonBest:  gRecognizerの音声認識結果から第1候補を抽出 (zip)
    • gWaveCutter:  発話区間切り出し (zip)
  • NICTサービス音声システム 詳細
    • kmSpeech:  nictのWEBサービスを利用した音声合成 (zip)
    • kmRecognizer: nictのWEBサービスを利用した音声合成(zip)

接続方法と詳しい説明はホームページを参照ください。

情報検索

詳細
  • gSearch: googleの提供するAPIによる情報検索 (zip)
  • rShopSearch: 楽天商品情報検索(zip)
  • gImage: google画像検索 (zip)

接続方法と詳しい説明はホームページを参照ください。

使用例

web_kmspeech_example.png
図のように接続し、マイクとスピーカを調整し、例えばマイクに向かって「こんにちは」と発話してみてください。音声認識が成功するとそのまま音声合成されます。

詳細とそのほかの例については下のリンクをご参照ください。
問合先(メールアドレス): 
shimotomai@lab.tamagawa.ac.jp
Resources
Project Information
OS: 
Windows
言語: 
Python
OpenRTM ver.: 
1.1
Average: 
4
Average: 4 (1 vote)
Last modified: 
Thu, 2013-12-19 22:14

Comments

Author: 

何かscreenshotを貼り付けてください。

Author: 

音声認識に使用したロボットの写真と、使用した接続の説明を追加いたしました。ホームページに詳細を記載いたしました。

Download

latest Releases : 2.0.0-RELESE

2.0.0-RELESE Download page

Number of Projects

Choreonoid

Motion editor/Dynamics simulator

OpenHRP3

Dynamics simulator

OpenRTP

Integrated Development Platform

AIST RTC collection

RT-Components collection by AIST

TORK

Tokyo Opensource Robotics Association

DAQ-Middleware

Middleware for DAQ (Data Aquisition) by KEK