オルツの「LHTM-OPT2」、日本語RAG(検索拡張生成)で軽量型LLMとして世界最高の精度と推論速度を実現
株式会社オルツは、新たな軽量型大規模言語モデル「LHTM-OPT2」を発表しました。このモデルは日本語のRAG(検索拡張生成)の精度で世界最高を達成しています。評価は独自のWikipediaデータセットと東京大学入試の国語科目データセットで行われ、「LHTM-OPT2」はGPT-4oに匹敵する精度を示しました。また、これまでの軽量型LLM(パラメータ数10B以下)の中で日本国内トップのスコアを記録し、推論速度でも記録を更新しました。オルツは今後も技術開発を進め、アジアにおけるOpenAIの地位を確立することを目指しています。
2024年10月29日
株式会社オルツ
株式会社オルツ(本社:東京都港区、代表取締役:米倉 千貴、以下、オルツ)は、当社が開発する軽量大規模言語モデル「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2(ラートム・オプト2)」をリリースいたしました。「LHTM-OPT2」は、RAG(検索拡張生成)の精度を最適化する軽量型LLMであり、日本語RAG精度において、軽量型LLMで世界最高精度※1 を達成したことをお知らせいたします。
※ご参考:LHTM-OPTについて:https://alt.ai/news/news-2300/
※ご参考:LHTM-OPT、AWS Marketplace上に日本語LLMとして世界初公開:https://alt.ai/news/news-2553/
【画像:https://kyodonewsprwire.jp/img/202410298947-O1-l23KzO74】
「LHTM-OPT」は、小規模GPUマシンで実用的な、パラメータ数が最適化された新たな軽量型大規模言語モデルです。この度、「LHTM-OPT」シリーズの最新バージョン「LHTM-OPT2」の日本語RAG精度にあたり、オルツが独自に開発したWikipediaデータからのRAG質問・回答のデータセット(Wiki RAGデータセット)と、東京大学入学試験の国語科目データセットを用いて評価を行いました。
Wiki RAGデータセットを作成する手法は、日本語Wikipediaから特定の段落を抽出し、その段落に基づく質問を生成し、[段落、 質問、 正解] の3つ組を作成することです。このデータは、専門家の手によって再度確認、修正を行うことで、高品質のRAGベンチマークになります。
また、東京大学入学試験の国語科目データセット評価では、東京大学入学試験※2 における国語大学科目問題の前提テキスト(段落)とその設問をRAGの入力とし、LLMがその段落と設問から生成した回答を専門家が評価しました。
評価結果では、Wikipedia RAGデータセットでは、「LHTM-OPT2」が、GPT-4oと同等レベルの精度(LHTM-OPT2:91.0%、GPT-4o:90.8%)を達成しました。また、東大入試国語科目におけるRAGに関する質問では、「LHTM-OPT2」が、GPT-4oの94%の精度を達成しました。
さらに、RAG評価においては、国内の全ての軽量型LLM(パラメータ数が10B以下のLLM)を上回る高い精度を達成し、「JGLUE(Japanese General Language Understanding Evaluation)」ベンチマークや「Japanese MT-Bench(MTベンチ)※3」でも、軽量型LLMとしての最高スコアを記録しました。
推論速度に関しては、SambaNova社の協力を得て、日本語推論において平均速度500TPS(トークン/秒)、最大速度796TPSを確認しました。この速度は、日本語LLM推論速度の最高記録※4 です。
※1 世界最高精度・最高スコア:
「弊社が独自に開発した日本語WikipediaデータによるRAGデータセット」というLLM・RAGベンチマークによる評価で、軽量型LLMとして、パラメータ数が10B以下のモデルの中での比較として国内トップスコアを達成。
(2024年10月15日時点。自社調べ)
※2 これまでの東京大学入学試験問題及び解答等:https://www.u-tokyo.ac.jp/ja/admissions/undergraduate/e01_04.html
※3 「Japanese MT-Bench」はStability AI社が提供しているベンチマークテストです。2024年10月15日に性能評価した結果、軽量型LLMとして最高点の評価を得ました。ベンチマークテストとは、定められた基準を元にその性能を測定する方法で、「Japanese MT-Bench」はGPT-4を評価者としたものです。
※4 最高記録:
ArtificialAnalysis.ai によると、既存のLLMでは、Cerebrasが最速の2148 TPS で、SambaNovaが2番の速度(462 TPS)。ただし、日本語専用のLLM超高速推論は、オルツとSambaNova社が初めて実現しました。
(2024年10月15日時点。自社調べ)
https://artificialanalysis.ai/#providers
オルツは、今後も「LHTM-OPT」シリーズの開発と提供を通じて、より高精度で効率的な言語モデルの開発を進め、世界水準の技術で "アジアにおけるOpenAI” の地位確立を目指します。そして、顧客へ最高品質のソリューションを提供することで、日本企業の労働生産性向上に資する取組みを推進してまいります。
▶LHTM-2/LHTM-OPT/GPT など大規模言語処理ソリューションに関するお問い合わせ先
https://alt.ai/aiprojects/gpt/
■株式会社オルツについて
2014年11月に設立された当社は、「P.A.I.」(パーソナル人工知能)、AIクローンをつくり出すことによって「人の非生産的労働からの解放を目指す」企業です。また、AIの対話エンジンの開発から生まれた音声認識テクノロジーを活用したCommunication Intelligence「AI GIJIROKU」を筆頭として、そのほか、PoC(Proof of Concept、概念実証)により様々なビジネス上の課題を切り口としてソリューション展開するプロダクト(「altBRAIN」、「AIコールセンター」、「CLONEdev」など)を開発・提供しています。
https://alt.ai/
商号 :株式会社オルツ
代表者 :代表取締役社長 米倉 千貴
事業内容:デジタルクローン、P.A.I.の開発を最終目的とした要素技術の研究開発とそれらを応用した
製品群(Communication Intelligence「AI GIJIROKU」等)の展開、AIソリューションの提供
創業 :2014年11月
所在地 :東京都港区六本木七丁目15番7号
<報道関係者からのお問い合わせ先>
株式会社オルツ 広報 西澤
e-mail:press@alt.ai
<アライアンスに関するお問い合わせ先>
株式会社オルツでは、IT・金融・建設・物流・メディア・製造・小売・サービス業など、
ジャンルを問わずAIソリューションの提供および支援を行っております。
お気軽にお問い合わせください。
株式会社オルツ 事業本部 小村
e-mail:gptsolutions@alt.ai
田代まさし氏、志村けんさんに「挨拶がねえ」と怒った“超大物”の実名を告白「同じクラブで…」
田代まさし氏、最盛期の衝撃月収&年収告白「出演料は志村さんに比べれば全然安いですけど」
運転免許証無事故・無違反の方は必見 SDカードで引っ越し代・カラオケ・レストラン等をお得に
【日本ハム】野村佑希、1時間超内野特守 来季の巻き返しへ攻守とも突き詰める
北村有起哉、結のギャル姿に「あのひまわり、大きかった」回想、華丸「寛大ですね」朝ドラ受け
【阪神】井上広大、一塁守備練習継続の意図とは?田中内野守備走塁コーチが明かす
ギガフォトン、先端半導体パッケージ用加工向けエキシマレーザーを米国に設置
クレジットカード情報漏洩の実態とECサイトの安全対策
【EL】久保建英、得点絡めず後半15分に途中交代 チームは終盤失点でプルゼニに敵地で敗戦
大きくなって帰ってきたファミマの「クリスピーチキン(ハバネロホット)」発売中!
父が再婚の丸山隆平(36)現在の家族関係がとんでもないことになっていたと話題に
元国民的美少女タレント、顔面大火傷 ファン心配「これはひどい」「キレイなお顔が、、、」
サンド伊達みきお、新幹線でまさかの“隣同士”に「誰かに見つかったら…」
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
3時のヒロイン福田麻貴(32)は元アイドルだった!昔の姿がかわいいとヲタク歓喜
河野太郎氏「私が外国出身であるとか…」誹謗中傷アカウントへの開示命令発令を報告
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
田代まさし氏、志村けんさんに「挨拶がねえ」と怒った“超大物”の実名を告白「同じクラブで…」
ガーシーが綾野剛のLINE公開でネット騒然「ショック」「すごいエンタメ」
「愛が生まれた日」藤谷美和子(56)の現在がヤバい!?徘徊生活を送っていた過去も明らかに。
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
ガーシー、橋本環奈と片寄涼太を暴露するも片寄の好感度が上がったワケ
四千頭身、テレビから消えた理由を明かすも批判殺到「人のせいにするな」
吉田沙保里、大久保嘉人との不倫疑惑を一蹴するも冷ややかな声
猫の『ヘッドプレッシング』って何?危険な8つの兆候と対策を解説!
たぬかな、「あのチビやろ?」迷惑系黒人YouTuberへの苦言が物議
クロちゃんを騙した「レイちゃま(小林レイミ)」の現在が別人すぎると話題に
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
田代まさし氏、志村けんさんに「挨拶がねえ」と怒った“超大物”の実名を告白「同じクラブで…」
田代まさし氏、最盛期の衝撃月収&年収告白「出演料は志村さんに比べれば全然安いですけど」
運転免許証無事故・無違反の方は必見 SDカードで引っ越し代・カラオケ・レストラン等をお得に
【日本ハム】野村佑希、1時間超内野特守 来季の巻き返しへ攻守とも突き詰める
北村有起哉、結のギャル姿に「あのひまわり、大きかった」回想、華丸「寛大ですね」朝ドラ受け
【阪神】井上広大、一塁守備練習継続の意図とは?田中内野守備走塁コーチが明かす
ギガフォトン、先端半導体パッケージ用加工向けエキシマレーザーを米国に設置
クレジットカード情報漏洩の実態とECサイトの安全対策
【EL】久保建英、得点絡めず後半15分に途中交代 チームは終盤失点でプルゼニに敵地で敗戦
大きくなって帰ってきたファミマの「クリスピーチキン(ハバネロホット)」発売中!