【画像 https://www.dreamnews.jp/?action_Image=1&p=0000242583&id=bodyimage1

クリスタルメソッド株式会社は、形態素に分解された日本語に読み仮名を振るエンジン「かな振りAPI」の解析が行われる辞書情報を2021年8月20日に改良し、形態素ごとに換算すると99.98%の高精度化に成功しました。

概要はつぎの通りです。

 従来の形態素解析による読み仮名エンジンでは、コンピュータが文章を解析する時に、読み仮名や単語の区切りが曖昧なことがあり、実際に人間が読む文章とは違ってしまうことがあり、
さらに日本語をすべて平仮名で表すと、その文の曖昧性は非常に高くなる、という問題があります。

 今回、弊社が改良を行った内容として、
・文章のカタカナ読みを予測するのに特化したAIを使用
・解析が行われる辞書情報を自社AIにより改良、作成

これにより、文章に出てくる単語をより高精度に区切ることができるようになり、特に改良された点として、読み仮名を選択する精度が格段に上がりました。

 例えば、文章の内容によって「今日」という単語を「きょう」ではなく「こんにち」と読めるようになったり、特に読み間違えやすい語に対しても、文章の流れからAIが読み方を推測して、適切な読み仮名を付けることが可能になりました。
 例えば「的:マト,テキ」のように、複数読み方がある単語に対して、どれほど適切な読みを選択出来るか検証を行なったところ、他社APIが46%の確率に対し、自社の読みエンジンは73%の確率で適切な読みを選択できるという結果になりました。


【単語区分の解析改良例】

◆友人もなくいじめの的になっていた転校生の精いっぱいのパフォーマンス。

【画像 https://www.dreamnews.jp/?action_Image=1&p=0000242583&id=bodyimage2


◆下今市駅―鬼怒川温泉駅間

【画像 https://www.dreamnews.jp/?action_Image=1&p=0000242583&id=bodyimage3


【複数読み方がある語に対する改良例】

◆部屋を出てそのすぐ後

【画像 https://www.dreamnews.jp/?action_Image=1&p=0000242583&id=bodyimage4


【お問い合わせ先】名称:クリスタルメソッド株式会社
住所:東京都 千代田区九段北4-1-14 TLビル5階
担当者: 蘇、河合
TEL: 03-6265-4755
E-mail: info@crystal-method.com

お問い合わせフォーム:https://form.run/@HowToRead



配信元企業:クリスタルメソッド株式会社
プレスリリース詳細へ

ドリームニューストップへ
情報提供元: Dream News
記事名:「 自社エンジンによるかな振りAPIの精度向上に成功 ~従来のオープンソースのエンジンから33%の精度アップ~