RAGにおけるSSD容量と検索性能の柔軟なバランスを可能に


東京--(BUSINESS WIRE)--(ビジネスワイヤ) --キオクシア株式会社は、SSDを活用した生成AI用ベクトル探索ソフトウェアKIOXIA AiSAQ™(キオクシア アイザック)にRAG(Retrieval Augmented Generation)システムの応答性能と回答精度という相反する要素のバランスを調整できる機能を追加しました。システム設計者はハードウェアの構成を変更せずに、搭載されたSSD容量の中でKIOXIA AiSAQの検索性能または最大ベクトル数のバランスを柔軟に調節することが可能となります。
2025年1月に発表したKIOXIA AiSAQ(All-in-Storage ANNS with Product Quantization)ソフトウェアは、SSDに最適化した新しいANNS(Approximate Nearest Neighbor Search:近似最近傍探索)アルゴリズムを使用しており、インデックス化されたデータをDRAMではなくSSDに配置するため、DRAM容量に制限されずにベクトルデータベースを拡張できます。
RAGシステムに搭載されているSSDの容量が固定されている場合、検索性能(時間あたりの応答数)向上には、ベクトルごとのSSD消費容量を増やす必要があり、その結果、保持できる最大のベクトル数は少なくなり、RAGシステムの回答精度の低下につながります。一方、RAGシステムの回答精度を重視しベクトル数を増やすためには、ベクトルごとのSSD消費容量を抑えなければならず、検索性能の低下につながります。今回の新機能の追加により、RAGシステムごとのワークロードに合わせ、これら2つの相反する条件を適切なバランスに調整することが可能となりました。また、検索性能とベクトル数のバランスの最適化を行えるようになったことで、RAGアプリケーションだけでなくオフラインセマンティック検索など他のベクトル集約型アプリケーションにもKIOXIA AiSAQの用途が広がります。
AIサービスの大規模化への需要が高まる中、DRAMに代わる実用的な選択肢として、SSDはRAGシステムに高スループットと低レイテンシーを提供します。KIOXIA AiSAQはこのような要求に効率的に応え、DRAM容量に制限されることなく大規模な生成AIを実現します。
KIOXIA AiSAQをオープンソースとして公開することにより、SSD中心のアーキテクチャーによるAIシステムの発展を推進し、AIコミュニティーに貢献します。
「KIOXIA AiSAQ」の公開先:
https://github.com/kioxia-jp/aisaq-diskann
※ KIOXIA AiSAQ (All-in-Storage ANNS with Product Quantization) は、キオクシアの商標です。
※ その他記載されている社名・製品名・サービス名などは、それぞれ各社が商標として使用している場合があります。
本資料に掲載されている情報(製品の仕様、サービスの内容およびお問い合わせ先など)は、発表日現在の情報です。予告なしに変更されることがありますので、あらかじめご了承ください。
Contacts
報道関係の本資料に関するお問い合わせ先:
キオクシア株式会社
営業企画部
進藤智士
Tel: 03-6478-2404