ailia AI Speechは、ailia SDKを使用して開発された。「Open AI」が開発した音声認識モデル「Whisper」を、アプリケーションソフトウェアに実装できる。「C++」や「Unity」に対応しており、PC、スマートフォンへ高性能音声AIを実装することができる。99言語の音声認識に対応し、多言語の英語へのリアルタイム翻訳が可能である。高速・高精度の音声認識を、クラウドへの接続不要なエッジAIとして実現する。プライバシーが重要な用途でも使用可能となる。
ailia AI Speechは、NVデバイスが開発・販売している食品工場における非接触センサーモジュールの作業記録等を音声で文字入力する機能に採用されている。音声からの書類自動作成やコールセンターの対応力強化、電話を使った犯罪の抑止、動画・音声ファイルの台詞による検索・自動分割・編集、ChatGPTを活用したアバターとのコミュニケーションにおける音声入力といった様々な応用例が考えられる。