Unityと音声認識

Unityと音声認識

Unityと音声認識

Unityでの音声認識による操作について調査したので簡単にまとめてみる。
お仕事になるかどうかまだ分からないので、さらっと検索しただけです。

Unityと音声認識

Unityから音声認識の機能を利用するためには以下の方法が考えられる。

クラウドサービスを使用する
デバイスの機能を使用する
音声認識ライブラリを使用する

クラウドサービスを使用する

メリット
- 実装が容易
- デバイスが違っても全く問題ない
デメリット
- タイムラグがある (要検証)
- 従量課金

GoogleかIBM Watsonあたり？
Azureは情報が少ない感じ。

デバイスの機能を使用する

Androidもできそう。
Mac/Linuxはなさそう？
(VRアプリという観点からはMac/Linuxは無視しても良さそうだが)

マルチプラットフォームとするのなら、デバイスの差異を吸収するようなラッパーを実装する必要がありそう。

メリット
- (対応デバイスの種類が少なければ)実装は容易
- 無料
デメリット
- 対応デバイスが増えると実装・テストが複雑になる

音声認識ライブラリを使用する

Juliusというオープンソースのライブラリがあり、それを使うのが良い感じ。

マルチプラットフォームとするのであれば、この方法が良いかも。
ただ、実装面では一番面倒くさい上に辞書なども含む必要があるのでアプリのサイズがすごく大きくなりそう。

メリット
- 多くのプラットフォームに対応可能
- 無料
デメリット
- 実装、ビルド環境の構築に手間がかかる
- アプリサイズが大きくなりそう (要検証)

参考

コメント