コミュニケーションロボットを用いた音声対話に基づくWebブラウザ制御システム

コミュニケーションロボットを用いた音声対話に基づくWebブラウザ制御システム

投稿者: 
root

 centor

概要

  • 近年グループウェア,学習支援システム,窓口業務システムなど様々なサービスが, Webブラウザ上で利用されるいわゆるWebシステムとして提供されるようになった.一方既存システムの変更の際には,従来システムへの影響を十分に考慮する必要があり,各機能の保守や改良への対応が困難である.本プロジェクトでは,これらの問題を解決するために,既存サービスの API や SDK を利用せず,Webブラウザを制御することでシステムを動作させる枠組みを提案する.クラウドAIサービスを利用し短期間かつ容易に開発可能なシステムの一例として, 音声認識・合成,RGBDカメラによる画像認識を活用したWebブラウザ検索システムをRTミドルウェアの枠組みを用いて開発し,そのシステム構築例として示す.
     centor
    (梅谷,北村,第40回日本ロボット学会学術講演会予稿集(2022)より引用)

プロジェクトの詳細

  • 本プロジェクトでは,対話型インタフェースの情報サービスにおいて,音声対話を通してユーザの要求を抽出し,Webブラウザのスクレイピングにより情報サービスシステムの操作および情報抽出を行うことで,ロボットによるサービス提供機能を追加するための枠組みを提案しています.本プロジェクトでは,情報サービスがWebブラウザを用いて提供されていることを想定しています.スマートフォンのアプリケーションがWebブラウザを利用して構築されていることからも,開発の一般性を失うものではないといえます.
  • ここで,従来のコンピュータ上の操作では,セキュリティの問題から他のソフトウェアプロセスを制御することは非常に難しいです.既存システムのAPIやSDKを利用すれば既存の情報サービスにアクセスできますが,開発コストがかかります,一方,WebブラウザはHTTPSのみを利用して操作でき,ネットワーク設計においてもPCシステムではHTTPSのみ開放されているケースも多くあります.
  • したがって,ロボットシステムが人間向けのソフトウェアを直接利用できる.つまり,既存システムのAPIやSDKを利用したプログラミングが不要であり,短期間での開発が可能となります.また,対話機能はクラウドAIサービスを利用するため,内製あるいはインストールする必要がなく,さらにAIの発展の恩恵をリアルタイムに受けることができます.
  • 実際の作例として,現在大学図書館で稼働しているヘルプデスク支援ロボットのRTコンポーネント化を通して,手法の可能性を示します.

    仕様

  • OS Windows11
  • 開発言語 Python3.10.8

    ソースコード

問合先(メールアドレス): 
s2271108@s.konan-u.ac.jp
Project Information
OS: 
Windows
言語: 
Python
OpenRTM ver.: 
2.0
embedded video: 
Embedded thumbnail for コミュニケーションロボットを用いた音声対話に基づくWebブラウザ制御システム
Average: 
3
Average: 3 (1 vote)
最終更新日時: 
水, 2023-12-13 23:24

ダウンロード

最新バージョン : 2.0.1-RELESE

統計

Webサイト統計
ユーザ数:2209
プロジェクト統計
RTコンポーネント307
RTミドルウエア35
ツール22
文書・仕様書2

Choreonoid

モーションエディタ/シミュレータ

OpenHRP3

動力学シミュレータ

OpenRTP

統合開発プラットフォーム

産総研RTC集

産総研が提供するRTC集

TORK

東京オープンソースロボティクス協会

DAQ-Middleware

ネットワーク分散環境でデータ収集用ソフトウェアを容易に構築するためのソフトウェア・フレームワーク