Apache OpenNLP
固有表現抽出の実行例
画像1: https://www.atpress.ne.jp/releases/160534/LL_img_160534_1.png
Apache OpenNLP
機械学習による自然言語処理エンジンApache OpenNLPは7月2日にロンウイット代表関口が日本語関連の開発検証に携わった最新バージョン1.9.0をリリースしました。
サポートサービスを提供するOpenNLPの機能は以下の通りです。
○固有表現抽出
日本語などの自然言語で書かれたテキストには人名、地名、組織名などの固有名詞が含まれています。これらの固有名詞を属性(固有名詞タイプ)付きで抽出する技術が「固有表現抽出」と呼ばれます。たとえば、検索エンジンなどのアプリケーションと組み合わせて使うことで精度向上に役立てることができます。
固有名詞タイプは、人名など一般的なものから、病名、料理名、イベント名など、アプリケーションに応じてさまざまなタイプを使うことができます。以下にOpenNLPを使ってさまざまなタイプの固有名詞を抽出する解説記事を掲載します。
https://www.rondhuit.com/apache-opennlp-1-9-0-ja-ner.html
○文書分類
新聞記事など自然言語で書かれた記事・文書に分類ラベルを自動付与する機能です。たとえば文書を投稿するサイトで、投稿された文書に自動的に「スポーツ」「芸能」「政治」「経済」などのラベルを自動付与するなどの応用例が考えられます。
分類される対象はテキスト文書に限りませんので、自動与信審査やスパムメール判定などにも応用することが可能です。
○言語判別
自然言語で書かれたテキストが「何語」で書かれているかを自動判別する機能です。
日本語、英語、中国語など103言語に対応します。
OpenNLPの利用には専門知識が必要となるため、ロンウイットでは導入を支援するコンサルティングサービスも提供開始し、ユーザー企業自身が専門知識を習得できるよう研修コースの開発や運用後のアセスメントサービスも計画しています。
■会社概要
商号 : 株式会社ロンウイット
代表者: 代表取締役社長 関口 宏司
所在地: 〒101-0034
東京都千代田区神田東紺屋町28-1 神田EAST 4階
設立 : 2006年5月
URL : https://www.rondhuit.com/