オルツの「LHTM-OPT2」、日本語RAG(検索拡張生成)で軽量型LLMとして世界最高の精度と推論速度を実現
株式会社オルツは、新たな軽量型大規模言語モデル「LHTM-OPT2」を発表しました。このモデルは日本語のRAG(検索拡張生成)の精度で世界最高を達成しています。評価は独自のWikipediaデータセットと東京大学入試の国語科目データセットで行われ、「LHTM-OPT2」はGPT-4oに匹敵する精度を示しました。また、これまでの軽量型LLM(パラメータ数10B以下)の中で日本国内トップのスコアを記録し、推論速度でも記録を更新しました。オルツは今後も技術開発を進め、アジアにおけるOpenAIの地位を確立することを目指しています。
2024年10月29日
株式会社オルツ
株式会社オルツ(本社:東京都港区、代表取締役:米倉 千貴、以下、オルツ)は、当社が開発する軽量大規模言語モデル「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2(ラートム・オプト2)」をリリースいたしました。「LHTM-OPT2」は、RAG(検索拡張生成)の精度を最適化する軽量型LLMであり、日本語RAG精度において、軽量型LLMで世界最高精度※1 を達成したことをお知らせいたします。
※ご参考:LHTM-OPTについて:https://alt.ai/news/news-2300/
※ご参考:LHTM-OPT、AWS Marketplace上に日本語LLMとして世界初公開:https://alt.ai/news/news-2553/
【画像:https://kyodonewsprwire.jp/img/202410298947-O1-l23KzO74】
「LHTM-OPT」は、小規模GPUマシンで実用的な、パラメータ数が最適化された新たな軽量型大規模言語モデルです。この度、「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2」の日本語RAG精度にあたり、オルツが独自に開発したWikipediaデータからのRAG質問・回答のデータセット(Wiki RAGデータセット)と、東京大学入学試験の国語科目データセットを用いて評価を行いました。
Wiki RAGデータセットを作成する手法は、日本語Wikipediaから特定の段落を抽出し、その段落に基づく質問を生成し、[段落、 質問、 正解] の3つ組を作成することです。このデータは、専門家の手によって再度確認、修正を行うことで、高品質のRAGベンチマークになります。
また、東京大学入学試験の国語科目データセット評価では、東京大学入学試験※2 における国語大学科目問題の前提テキスト(段落)とその設問をRAGの入力とし、LLMがその段落と設問から生成した回答を専門家が評価しました。
評価結果では、Wikipedia RAGデータセットでは、「LHTM-OPT2」が、GPT-4oと同等レベルの精度(LHTM-OPT2:91.0%、GPT-4o:90.8%)を達成しました。また、東大入試国語科目におけるRAGに関する質問では、「LHTM-OPT2」が、GPT-4oの94%の精度を達成しました。
さらに、RAG評価においては、国内の全ての軽量型LLM(パラメータ数が10B以下のLLM)を上回る高い精度を達成し、「JGLUE(Japanese General Language Understanding Evaluation)」ベンチマークや「Japanese MT-Bench(MTベンチ)※3」でも、軽量型LLMとしての最高スコアを記録しました。
推論速度に関しては、SambaNova社の協力を得て、日本語推論において平均速度500TPS(トークン/秒)、最大速度796TPSを確認しました。この速度は、日本語LLM推論速度の最高記録※4 です。
※1 世界最高精度・最高スコア:
「弊社が独自に開発した日本語WikipediaデータによるRAGデータセット」というLLM・RAGベンチマークによる評価で、軽量型LLMとして、パラメータ数が10B以下のモデルの中での比較として国内トップスコアを達成。
(2024年10月15日時点。自社調べ)
※2 これまでの東京大学入学試験問題及び解答等:https://www.u-tokyo.ac.jp/ja/admissions/undergraduate/e01_04.html
※3 「Japanese MT-Bench」はStability AI社が提供しているベンチマークテストです。2024年10月15日に性能評価した結果、軽量型LLMとして最高点の評価を得ました。ベンチマークテストとは、定められた基準を元にその性能を測定する方法で、「Japanese MT-Bench」はGPT-4を評価者としたものです。
※4 最高記録:
ArtificialAnalysis.ai によると、既存のLLMでは、Cerebrasが最速の2148 TPS で、SambaNovaが2番の速度(462 TPS)。ただし、日本語専用のLLM超高速推論は、オルツとSambaNova社が初めて実現しました。
(2024年10月15日時点。自社調べ)
https://artificialanalysis.ai/#providers
オルツは、今後も「LHTM-OPT」シリーズの開発と提供を通じて、より高精度で効率的な言語モデルの開発を進め、世界水準の技術で "アジアにおけるOpenAI” の地位確立を目指します。そして、顧客へ最高品質のソリューションを提供することで、日本企業の労働生産性向上に資する取組みを推進してまいります。
▶LHTM-2/LHTM-OPT/GPT など大規模言語処理ソリューションに関するお問い合わせ先
https://alt.ai/aiprojects/gpt/
■株式会社オルツについて
2014年11月に設立された当社は、「P.A.I.」(パーソナル人工知能)、AIクローンをつくり出すことによって「人の非生産的労働からの解放を目指す」企業です。また、AIの対話エンジンの開発から生まれた音声認識テクノロジーを活用したCommunication Intelligence「AI GIJIROKU」を筆頭として、そのほか、PoC(Proof of Concept、概念実証)により様々なビジネス上の課題を切り口としてソリューション展開するプロダクト(「altBRAIN」、「AIコールセンター」、「CLONEdev」など)を開発・提供しています。
https://alt.ai/
商号 :株式会社オルツ
代表者 :代表取締役社長 米倉 千貴
事業内容:デジタルクローン、P.A.I.の開発を最終目的とした要素技術の研究開発とそれらを応用した
製品群(Communication Intelligence「AI GIJIROKU」等)の展開、AIソリューションの提供
創業 :2014年11月
所在地 :東京都港区六本木七丁目15番7号
<報道関係者からのお問い合わせ先>
株式会社オルツ 広報 西澤
e-mail:press@alt.ai
<アライアンスに関するお問い合わせ先>
株式会社オルツでは、IT・金融・建設・物流・メディア・製造・小売・サービス業など、
ジャンルを問わずAIソリューションの提供および支援を行っております。
お気軽にお問い合わせください。
株式会社オルツ 事業本部 小村
e-mail:gptsolutions@alt.ai
小池里奈「超むっっっっっちむち」美バスト輝く黒ブラジャー近影に称賛「色気が増してる」
絶賛大ゲンカ中の大型犬たちの間に『赤ちゃんが入ってきた』結果…とんでもなく優しい『まさかの光景』が69万再生 我に返る姿が尊すぎると話題
44歳で第1子出産の宮崎宣子アナ、1歳長男のハイハイデビューを祝福「おめでとう!息子よ!」
リニューアルした「青春18きっぷ」の代わりに!2024年冬の行楽におすすめのお得な切符と使い方
美容整形約3億円ヴァニラ「Mカップ」谷間チラリ 酉(とり)の市を満喫
辻希美、夫・杉浦太陽と予想外のうれしい出来事に夫婦そろって「え」
多部未華子(30)結婚の裏事情あまりにも恐ろしすぎると話題に!
【阪神】藤川球児監督、選手にオフの心得説く「遊んで知見、視野広げて。ストレスかかる仕事」
殿堂入り候補イチロー氏のすごさ、投票の行方をメジャー取材経験豊富な米ベテラン記者4人が語る
紅白初出場こっちのけんと「病気に負けても自分には負けないために」双極性障害と1年間闘い
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
千鳥ノブ、突然の背中激痛で動けなくなり病院直行「診断名」明かす「3日ぐらい動けなかった」
「グラビア界の超新星」榎原依那がスケスケ悩殺Tシャツ姿公開「たまらん」「エロス」「血圧が」
金子恵美氏、玉木雄一郎代表の「不愉快極まりない一言」を痛烈指摘「いらないですよ、そんなの」
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
斎藤元彦・前知事の再選確実 兵庫県知事選、失職から返り咲き
岡田将生が高畑充希との結婚発表
三浦瑠璃氏、斎藤元彦氏再選に「一番の敗者は当然、マスコミです」と私見
飯島直子「男性陣がやたらとバックしたがる」好きなしぐさが周囲にバレて…
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
大谷翔平の「盗塁」巡り訴訟、ドジャースなどが訴えられる 50、51個目の盗塁が対象
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
父が再婚の丸山隆平(36)現在の家族関係がとんでもないことになっていたと話題に
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
3時のヒロイン福田麻貴(32)は元アイドルだった!昔の姿がかわいいとヲタク歓喜
ガーシー、橋本環奈と片寄涼太を暴露するも片寄の好感度が上がったワケ
小池里奈「超むっっっっっちむち」美バスト輝く黒ブラジャー近影に称賛「色気が増してる」
絶賛大ゲンカ中の大型犬たちの間に『赤ちゃんが入ってきた』結果…とんでもなく優しい『まさかの光景』が69万再生 我に返る姿が尊すぎると話題
美容整形約3億円ヴァニラ「Mカップ」谷間チラリ 酉(とり)の市を満喫
44歳で第1子出産の宮崎宣子アナ、1歳長男のハイハイデビューを祝福「おめでとう!息子よ!」
マスク氏の影響力、スウィフトさんを上回る 米大統領選巡る世論調査
紅白初出場こっちのけんと「病気に負けても自分には負けないために」双極性障害と1年間闘い
JR東海が駅の空きスペースを活用する実証実験、マッチングサービス使って地域活性化を支援
リニューアルした「青春18きっぷ」の代わりに!2024年冬の行楽におすすめのお得な切符と使い方
しゃべるぬいぐるみを買ったら、犬がコソコソと…まさかの『内緒話をしている光景』と結末が298万再生「楽しそうで良き」「最後で吹いたw」
【2024年12月】HISの国内/海外クーポン・セール一覧まとめ 2000円/コードまとめ