オルツの「LHTM-OPT2」、日本語RAG(検索拡張生成)で軽量型LLMとして世界最高の精度と推論速度を実現
株式会社オルツは、新たな軽量型大規模言語モデル「LHTM-OPT2」を発表しました。このモデルは日本語のRAG(検索拡張生成)の精度で世界最高を達成しています。評価は独自のWikipediaデータセットと東京大学入試の国語科目データセットで行われ、「LHTM-OPT2」はGPT-4oに匹敵する精度を示しました。また、これまでの軽量型LLM(パラメータ数10B以下)の中で日本国内トップのスコアを記録し、推論速度でも記録を更新しました。オルツは今後も技術開発を進め、アジアにおけるOpenAIの地位を確立することを目指しています。
2024年10月29日
株式会社オルツ
株式会社オルツ(本社:東京都港区、代表取締役:米倉 千貴、以下、オルツ)は、当社が開発する軽量大規模言語モデル「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2(ラートム・オプト2)」をリリースいたしました。「LHTM-OPT2」は、RAG(検索拡張生成)の精度を最適化する軽量型LLMであり、日本語RAG精度において、軽量型LLMで世界最高精度※1 を達成したことをお知らせいたします。
※ご参考:LHTM-OPTについて:https://alt.ai/news/news-2300/
※ご参考:LHTM-OPT、AWS Marketplace上に日本語LLMとして世界初公開:https://alt.ai/news/news-2553/
【画像:https://kyodonewsprwire.jp/img/202410298947-O1-l23KzO74】
「LHTM-OPT」は、小規模GPUマシンで実用的な、パラメータ数が最適化された新たな軽量型大規模言語モデルです。この度、「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2」の日本語RAG精度にあたり、オルツが独自に開発したWikipediaデータからのRAG質問・回答のデータセット(Wiki RAGデータセット)と、東京大学入学試験の国語科目データセットを用いて評価を行いました。
Wiki RAGデータセットを作成する手法は、日本語Wikipediaから特定の段落を抽出し、その段落に基づく質問を生成し、[段落、 質問、 正解] の3つ組を作成することです。このデータは、専門家の手によって再度確認、修正を行うことで、高品質のRAGベンチマークになります。
また、東京大学入学試験の国語科目データセット評価では、東京大学入学試験※2 における国語大学科目問題の前提テキスト(段落)とその設問をRAGの入力とし、LLMがその段落と設問から生成した回答を専門家が評価しました。
評価結果では、Wikipedia RAGデータセットでは、「LHTM-OPT2」が、GPT-4oと同等レベルの精度(LHTM-OPT2:91.0%、GPT-4o:90.8%)を達成しました。また、東大入試国語科目におけるRAGに関する質問では、「LHTM-OPT2」が、GPT-4oの94%の精度を達成しました。
さらに、RAG評価においては、国内の全ての軽量型LLM(パラメータ数が10B以下のLLM)を上回る高い精度を達成し、「JGLUE(Japanese General Language Understanding Evaluation)」ベンチマークや「Japanese MT-Bench(MTベンチ)※3」でも、軽量型LLMとしての最高スコアを記録しました。
推論速度に関しては、SambaNova社の協力を得て、日本語推論において平均速度500TPS(トークン/秒)、最大速度796TPSを確認しました。この速度は、日本語LLM推論速度の最高記録※4 です。
※1 世界最高精度・最高スコア:
「弊社が独自に開発した日本語WikipediaデータによるRAGデータセット」というLLM・RAGベンチマークによる評価で、軽量型LLMとして、パラメータ数が10B以下のモデルの中での比較として国内トップスコアを達成。
(2024年10月15日時点。自社調べ)
※2 これまでの東京大学入学試験問題及び解答等:https://www.u-tokyo.ac.jp/ja/admissions/undergraduate/e01_04.html
※3 「Japanese MT-Bench」はStability AI社が提供しているベンチマークテストです。2024年10月15日に性能評価した結果、軽量型LLMとして最高点の評価を得ました。ベンチマークテストとは、定められた基準を元にその性能を測定する方法で、「Japanese MT-Bench」はGPT-4を評価者としたものです。
※4 最高記録:
ArtificialAnalysis.ai によると、既存のLLMでは、Cerebrasが最速の2148 TPS で、SambaNovaが2番の速度(462 TPS)。ただし、日本語専用のLLM超高速推論は、オルツとSambaNova社が初めて実現しました。
(2024年10月15日時点。自社調べ)
https://artificialanalysis.ai/#providers
オルツは、今後も「LHTM-OPT」シリーズの開発と提供を通じて、より高精度で効率的な言語モデルの開発を進め、世界水準の技術で "アジアにおけるOpenAI” の地位確立を目指します。そして、顧客へ最高品質のソリューションを提供することで、日本企業の労働生産性向上に資する取組みを推進してまいります。
▶LHTM-2/LHTM-OPT/GPT など大規模言語処理ソリューションに関するお問い合わせ先
https://alt.ai/aiprojects/gpt/
■株式会社オルツについて
2014年11月に設立された当社は、「P.A.I.」(パーソナル人工知能)、AIクローンをつくり出すことによって「人の非生産的労働からの解放を目指す」企業です。また、AIの対話エンジンの開発から生まれた音声認識テクノロジーを活用したCommunication Intelligence「AI GIJIROKU」を筆頭として、そのほか、PoC(Proof of Concept、概念実証)により様々なビジネス上の課題を切り口としてソリューション展開するプロダクト(「altBRAIN」、「AIコールセンター」、「CLONEdev」など)を開発・提供しています。
https://alt.ai/
商号 :株式会社オルツ
代表者 :代表取締役社長 米倉 千貴
事業内容:デジタルクローン、P.A.I.の開発を最終目的とした要素技術の研究開発とそれらを応用した
製品群(Communication Intelligence「AI GIJIROKU」等)の展開、AIソリューションの提供
創業 :2014年11月
所在地 :東京都港区六本木七丁目15番7号
<報道関係者からのお問い合わせ先>
株式会社オルツ 広報 西澤
e-mail:press@alt.ai
<アライアンスに関するお問い合わせ先>
株式会社オルツでは、IT・金融・建設・物流・メディア・製造・小売・サービス業など、
ジャンルを問わずAIソリューションの提供および支援を行っております。
お気軽にお問い合わせください。
株式会社オルツ 事業本部 小村
e-mail:gptsolutions@alt.ai
大谷翔平の「盗塁」巡り訴訟、ドジャースなどが訴えられる 50、51個目の盗塁が対象
松本人志、文芸春秋との裁判取り下げ方針 性的行為強要疑惑報道から1年
ひろゆき氏、因縁の米山隆一氏と103万円の壁めぐり“舌戦”続く「立憲民主党の無能な味方」
お菓子に異物混入……シャトレーゼがお詫び 顧客への対応遅れも問題視
「100万円渡され結婚申し込まれた」 ドン・ファン殺害で被告の元妻
ダルビッシュ有、古巣・日本ハムの本拠地エスコンフィールド初来場 グッズショップで買い物騒然
メジャー最優秀新人にパドレスのスキーンズら ドラフト全体1位で11勝、防御率1点台
男性の下半身を触った疑い 東京・府中市議を逮捕 睡眠薬飲ませたか
伝説のディスコが、一夜限りで新潟のまちに蘇る! 『MAHARAJA NIGHT in Niigata』を2024年11月23日に開催
ファーストサマーウイカ、デマを完全否定 大河「光る君へ」出演巡り「改ざん話の拡散は心外」
大谷翔平の「盗塁」巡り訴訟、ドジャースなどが訴えられる 50、51個目の盗塁が対象
父が再婚の丸山隆平(36)現在の家族関係がとんでもないことになっていたと話題に
元国民的美少女タレント、顔面大火傷 ファン心配「これはひどい」「キレイなお顔が、、、」
サンド伊達みきお、新幹線でまさかの“隣同士”に「誰かに見つかったら…」
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
田代まさし氏、志村けんさんに「挨拶がねえ」と怒った“超大物”の実名を告白「同じクラブで…」
3時のヒロイン福田麻貴(32)は元アイドルだった!昔の姿がかわいいとヲタク歓喜
河野太郎氏「私が外国出身であるとか…」誹謗中傷アカウントへの開示命令発令を報告
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
「愛が生まれた日」藤谷美和子(56)の現在がヤバい!?徘徊生活を送っていた過去も明らかに。
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
ガーシー、橋本環奈と片寄涼太を暴露するも片寄の好感度が上がったワケ
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
吉田沙保里、大久保嘉人との不倫疑惑を一蹴するも冷ややかな声
猫の『ヘッドプレッシング』って何?危険な8つの兆候と対策を解説!
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
大谷翔平の「盗塁」巡り訴訟、ドジャースなどが訴えられる 50、51個目の盗塁が対象
松本人志、文芸春秋との裁判取り下げ方針 性的行為強要疑惑報道から1年
ひろゆき氏、因縁の米山隆一氏と103万円の壁めぐり“舌戦”続く「立憲民主党の無能な味方」
ダルビッシュ有、古巣・日本ハムの本拠地エスコンフィールド初来場 グッズショップで買い物騒然
「100万円渡され結婚申し込まれた」 ドン・ファン殺害で被告の元妻
お菓子に異物混入……シャトレーゼがお詫び 顧客への対応遅れも問題視
メジャー最優秀新人にパドレスのスキーンズら ドラフト全体1位で11勝、防御率1点台
男性の下半身を触った疑い 東京・府中市議を逮捕 睡眠薬飲ませたか
伝説のディスコが、一夜限りで新潟のまちに蘇る! 『MAHARAJA NIGHT in Niigata』を2024年11月23日に開催
ファーストサマーウイカ、デマを完全否定 大河「光る君へ」出演巡り「改ざん話の拡散は心外」