そこで、今回リリースするAI ASR サービスでは、下記の特長・機能を有しました。 (1)ワンストップで使える ASR サービス ASR モデルのリリースやアップデートから精査選抜されたオプションを組み込んだマネージドクラウドサービスで、対応する言語は100超、AI モデルの選定やファインチューイングをすることなく字幕生成を開始できます。モデル選定やファインチューイングが必要なユーザには、Gcore マネージドサービスチームが支援を提供します。
(2)スピードとコスト効率に優れた字幕生成 1時間程度の動画なら10分以下で字幕生成が可能です。ワードエラー率は4~5%の範囲にとどまり、人による作業よりも高い精度を誇ります。コンテンツによっては、特定言語や特定テーマドメイン用オープンソース ASR モデルを使用することで精度強化を図ることも選択肢の一つとなります。例えば、業界専門用語や複数言語が使われているケースでは、オープンソース活用を加えるというプロセスカスタマイズを施し、精度をより高めることも可能です。
ストリーミング・プラットフォーム責任者コメント コンテンツがグローバル化している今、視聴者へのリーチ手段として字幕はその重要度を増しています。Gcore AI ASR を有効に活用することで、コスト効率と精度の観点で放送や配信サービス刷新を、そして、なによりも、世界各地の視聴者に新しさとアクセシビリティを備えたコンテンツ配信が達成できます。これこそまさにソリューションとエッジインフラストラクチャ進化を推進するという Gcore が掲げるコミットメントです。(Alexey Petrovskikh, Head of Streaming Platform at Gcore)
※日本向けに以下追記、HQ版には記載なし (1)リリース配信時点で Gcore AI ASR でサポートされている機能は以下になります。 ・音声からの文字起こし ・字幕翻訳・生成 (2)リリース配信時点で Gcore AI ASR で日本語環境でサポートされている機能は以下になります。 ・日本語音声から日本語字幕生成 ・日本語音声から英語字幕生成 ・英語音声から日本語字幕生成
Gcore について ~ Gcore は2024年2月に10周年を迎えました(参考英文記事;Blog, Linkedin Post)。 Gcore はエッジ AI、クラウド、ネットワーク、セキュリティのグローバルソリューションプロバイダです。本社はルクセンブルク、600超の従業員と世界各地に10の営業拠点を擁しています。Gcore の IT インフラストラクチャは自社運用、拠点は6大陸にまたがり、グローバル平均レスポンスタイムは30ms、ヨーロッパ、アフリカ、LATAM における屈指のネットワークパフォーマンスを実現しています。ネットワークはTier IVとTier IIIのデータセンタに配備された世界各地の160超のPoPで構成され、110超Tbpsの帯域を誇ります。 Web サイト www.gcore.com