読者です 読者をやめる 読者になる 読者になる

Makery Blog

西麻布のクリエイティブラボ「Makery」でテクノロジーとアイデアをこねています。

Tokyo Design Week2015に出展した「VOICETORY」について

poster.jpg

10/30~11/3までTokyo Design Weekに「VOICETORY」という作品を出展しました。 

1回の体験時間が長めな作品ではありましたが、ほとんど空くことがなく5日間で1,130名の方々に体験していただけました。
体験した方々の反応がとても良かったので今後の展開を検討していきたいと思ってます。
初めてのイベントへの出展でしたが得るものは多かったです。

「VOICETORY」は絵本の読み聞かせをデジタルで拡張した作品です。
音声認識を使い、絵本を読んでいくと空間の映像が変化していく、という仕組みです。
会場での様子はこちら。

制作について簡単に説明しておきます。

●企画
音声認識を使おう」というところから始まりました。
他と差別化したい、というのが大きかったです。音声認識を使った作品は今までほとんど見かけなかったので。
(実際にお客様からそこを褒められることも何度か)
言葉を発する場面は何か、を検討した時に「絵本の読み聞かせ」という案が出ました。
新しいものを作るのではなく既存のもの、みんなが知ってるものをデジタルの力でより良いものにする、というのは魅力的だと思いました。
汎用性も意識してます。今後ビジネスにつなげたいからです。

音声認識
音声認識IntelのRealSence SDKを使用しました。
他のも少し試したのですが、RealSenceは楽に使えたし精度も良かったので。
グローバル展開はまだ分かりませんが、9ヶ国語いけるのもいいなと。
誤認識はまあまああります。テストしてみて多かった誤認識は変換するようにして精度を上げました。
ただ誤認識自体が面白い場合もあるので精度が上がってしまうのは寂しさもあります。。
認識した言葉は自動で漢字に変換されてしまいます。
子供向けなので取得した文字列をひらがなで表示したかったのでしが、SDKにはそういう機能は無かったです。
mecabなどを使って変更するしか無いかなと。(今回は諦めました)
会場は人も多いし周りの展示も音が出るので、ちゃんと音声認識が動作するのかが不安でした。
マイクを単一指向性のものにし、ミキサーを通して余計な音を減らし、ブース内に壁を設置したりなど、できる限り音声認識に支障が出ないような対策をしました。
テレビを大音量でつけた中で試したりしましたが、最悪しゃべった後にマイクのスイッチを切るorミキサーでボリュームをゼロにするなどすれば音声認識は可能だったのでこのまま進めようと判断しました。
結果的には全く問題無かったです。

●コンテンツ
コンテンツはUnityで制作しました。
RealSence SDK音声認識のサンプル(C++)にOSCで認識した文字列を送る機能を追加し、Unityで受け取って使用しました。
文字化けの問題があって結果的に、
音声認識のサンプル(C++

Max

Unity
という面倒な構成になりました。
※イベント終了後、RealSence SDKC#のサンプルをUnity用に移植できたので、Unityだけで完結できるようになりました。

「VOICETORY」に関するお問い合わせはこちらで。
https://www.bbmedia.co.jp/system/contact/form/