ロンドン--(BUSINESS WIRE)--(ビジネスワイヤ) --アジアの最大手クラウド・プロバイダーは、AI推論の需要増加に対応するために何に取り組んでいるのでしょうか。オムディアによる最新の調査は、AI推論運用の進化する課題、スループット、レイテンシ、多様なAIモデルへの対応における主要なトレードオフ、そして可能な解決策について詳しく分析しています。このレポートはまた、ファーウェイ、バイドゥ、アリババ、バイトダンス、テンセント、ネイバー、SKテレコム・エンタープライズといった企業についても詳細に取り上げています。さらに、これらの企業が提供しているGPU、AIアクセラレーター、AI最適化CPU、それらの価格、NVIDIA製GPUの備蓄状況、AIサービスのポートフォリオ、自社AIモデルおよびカスタム・チップ・プロジェクトの現状についても分析しています。


2024年から2025年はじめにかけて、米国の輸出規制が発動される前にNVIDIAのH800およびH20 GPUを大量に備蓄したにもかかわらず、これらの高性能チップは中国のクラウド・サービスでは入手が困難であり、主にハイパースケーラー自身のモデル開発プロジェクトに使用されていることが示唆されています。同様に、中国のAIチップ・プロジェクトを利用する選択肢も比較的少なく、例外としてはバイドゥのオンプレミス・クラウド製品や一部のファーウェイ・クラウド・サービスがありますが、提供範囲は限らています。中国のハイパースケール企業は、プレフィルと生成の分離といったベストプラクティスの採用において高度に進んでおり、基礎AIに関する重要な研究も発表しています。しかし、研究論文では、いくつかの顕著な例外を除き、訓練の実行に西洋のGPUが使用されていることが多く記載されています。
「中国半導体における真の成功は、アクセラレーターではなくCPUにあります」とオムディアの主任アナリストであり、同レポートの著者であるアレクサンダー・ハロウェルは述べています。「中国のArmベースCPUは明らかに大規模な生産が行われており、通常アマゾン ウェブ サービス(AWS)のGravitonシリーズのように並列ワークロード向けに最適化されています。アリババのYiTian 710のような製品は、比較的ユーザー数が少なくワークロードの多様性が高い企業環境において、同社のQwen3といった現世代の小規模AIモデルを提供するための経済的に魅力的なソリューションです。」
最新のGPUが必要な場合、オムディアが確認した中で最も強力な製品は、SKテレコムがラムダラボと提携して構築しているGPUアズ・ア・サービス(GPUaaS)製品です。オムディアは、中国のワークロードをグレート・ファイアウォールの外に移すことで、最新のGPUや追加の学習データへのアクセスを期待する動きが大きな関心を集めていると指摘しています。他の重要な発見においては、ほぼすべての企業が現在、ファイン・チューニングやその他のカスタマイズを可能にするモデル・アズ・ア・サービス(MaaS)のプラットフォームを提供しており、企業がAI機能を活用するための主流な手段となっています。中国のハイパースケーラーは、特にエッジでのAIアプリケーションのサポートに関心を持っています。例えば、バイトダンスは、レストランの厨房を監視し、シェフが帽子を着用しているかどうかを報告する、あらかじめパッケージ化されたソリューションを提供しています。
オムディアについて
オムディアは、インフォーマ・テックターゲット(Nasdaq:TTGT)の一部であり、テクノロジー分野に特化したリサーチおよびアドバイザリー・グループです。業界リーダーとの対話や数十万件に及ぶデータポイントに基づいたテクノロジー市場に関する深い知見により、同社の市場インテリジェンスは、顧客にとって戦略的な強みとなっています。私たちは研究開発(R&D)から投資収益(ROI)に至るまで、最も有望な機会を見極め、業界の前進を支援しています。
本記者発表文の公式バージョンはオリジナル言語版です。翻訳言語版は、読者の便宜を図る目的で提供されたものであり、法的効力を持ちません。翻訳言語版を資料としてご利用になる際には、法的効力を有する唯一のバージョンであるオリジナル言語版と照らし合わせて頂くようお願い致します。
Contacts
Fasiha Khan: fasiha.khan@omdia.com