AIを活用したニュース記事の自動要約における実証実験を実施
日本テレビ放送網株式会社 株式株式会社NTTドコモ
AIを活用したニュース記事の自動要約における実証実験を実施
~実用化に向け、自動要約システムのプロトタイプを開発~
日本テレビ放送網株式会社(以下、日本テレビ)と、株式会社NTTドコモ(以下、ドコモ)は、AIを活用したニュース記事の自動要約システム(以下、本システム)の実用化をめざす実証実験(以下、本実証実験)を行い、WEB用ニュース記事の要約作業を自動化するシステムのプロトタイプを開発しました。今後実用化をめざし、日本テレビ内にて現場担当者による事前の性能テストを行います。
ドコモは2016年より、AIを活用した本システムの研究開発に着手しており、文章の中から重要度の高い文章をAIが判定して抜粋したり、AIが言葉を補いながら新たに文を生成して要約したりする本システムを作成していました。
両者は2018年9月から、日本テレビが大量に保有する20万件近い過去記事データと人が要約したデータセットを本システムに学習させ、要約の精度向上に取り組むとともに、2019年5月から開始した本実証実験では、本システムの機能拡充やインターフェースの実装を行い、現場で使用するためのWEBアプリケーション型のプロトタイプを開発しました。
今回の機能拡充においては、日本テレビの原稿制作ノウハウをルールベースで実装するとともに、タイトルに含まれる単語やユーザーが指定した任意の単語の重要度を向上させ要約結果に反映する機能や、要約後の単語が要約前文章のどの部分で出現しているかをトレースできる機能など、現場の声を反映したアイデアを追加実装しています。
本システムの基盤となる技術には、NTTドコモ北京研究所(以下、北京研)の自動要約技術を用いています。本要約技術は、北京研がAI技術を用いて独自に開発したニューラルネットワーク(DNN:Deep Neural Networks)※1により実現されており、既存技術と比較して重要情報の網羅性を高めただけでなく、必要な接続詞などを選択・生成することにより読みやすい文章を生成します。
なお、本実証実験で開発したプロトタイプについて、2020年1月23日(木)~24日(金)に開催するドコモのイベント「DOCOMO Open House 2020」のAI展示ブースにて、実際にデモをご体感いただけます。
両社は今後現場での検証を通じてさらなる要約精度の向上を図り、本システムの実用化をめざしてまいります。
※1 ニューラルネットワーク:人間の脳の仕組みを模したAIの計算モデル手法のこと。
別紙
実証実験概要
■ 背景
日本テレビが運営するニュース専門サイト「日テレNEWS24」では、最新のニュースを動画とニュース原稿(全文記事と要約記事)で配信しており、特に要約記事をサイト上に表示することにより読者にニュース概要を分かりやすく伝えています。一方で、このニュース記事の要約作業には人手による要約の手間が発生しています。また、要約作業には熟練したスキルが必要であるため、スタッフの育成に一定期間の研修が必要で、人員の確保も課題となっています。
■ 本システムの概要
本システムは、要約手法の異なる「抽出式要約システム」と「生成式要約システム」の2つの自動要約システムに大別され、各々についてプロトタイプを開発しました。
1.抽出式要約システム
抽出式では、全文原稿から重要度の高い文を抜き出して要約します。
<基本機能>
・ AIを用いた文書要約機能
・ 要約元の全文原稿から、文単位でそのまま文章を抽出し、要約結果として表示
◆通常の抽出式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O1-tIir7j67 】
<追加機能>
・ 要約元原稿のニュース記事のタイトルやユーザーが指定した任意の単語を重要語とし判定し、要約結果に反映する機能
・ 要約結果が要約元原稿のどの文章から抽出されたのかをトレースする機能
・ あらかじめ設定した上限文字数内で要約を生成する機能
◆ヒントありの抽出式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O2-90oT4eb7 】
→人間が全文テキストの中から任意の重要部分を選択した場合、その重要部分が含まれる文を優先的に抽出することで、重要部分が必ず要約テキストに含まれるようにします。
2.生成式要約システム
生成式では、全文原稿からの抽出だけでなく、言葉を補いながら新たに文を生成して要約します。
<基本機能>
・ AIを用いた文書要約機能
・ 要約元の全文原稿を参考に、重要な文を抜き出して新たな文書を生成
◆通常の生成式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O3-6IK4NX22 】
<追加機能>
・ 要約元原稿のニュース記事のタイトルやユーザーが指定した任意の単語を重要語として判定し、要約結果に反映する機能
・ 要約結果が要約元原稿のどの文章から生成されたのかをトレースする機能
・ あらかじめ設定した上限文字数内で要約を生成する機能
・ 起承転結を考え、必要な接続詞などを選択・生成する機能
◆ヒントありの生成式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O4-j7TXp9F2 】
→人間が全文テキストの中から任意の重要部分を選択した場合、その重要部分に含まれる単語が必ず要約テキストに含まれるようにするとともに、その前後の文脈的に必要な部分の重要度を高め、結果的に要約文に含まれやすいようにします。
市村正親の16歳イケメン長男市村優汰、色気漂う”赤髪”ヘア公開し騒然「大物感がすごい」
【阪神】梅野隆太郎が今度は異例すぎる「膝ブロック」で窮地救う 走者進塁防いでリード保つ
「奇跡の…」「年々可愛く」55歳森高千里”超ミニ”驚異の美ボディーにネット騒然
【日本ハム】伊藤大海7回3失点降板で今季初黒星の危機も…打線が8回に執念で追いつき無傷継続
73歳岩城滉一「いつまでもこれで食っていけると思えない」 俳優業達観も副業の税高騰にぼやき
南部虎弾さん18歳下の妻「生涯現役貫いてやってくれた。それが自慢の旦那」19年には腎臓提供
【ソフトバンク】山川穂高が死球交代、アブレイユの157キロ左手直撃「骨のところ」監督も心配
73歳岩城滉一「指ちぎったのと足首クルッと回ったくらい」バイク壮絶けがも「今度レース出る」
GLAY・TERU「今でも仲良く遊び仲間。普通にご飯も一緒に」メンバーとの関係に言及
センバツ王者・健大高崎が5回コールド好発進 先発の下重賢慎が3回を8連続三振で無安打無失点
何があった!?「エアコン」が想定外の壊れ具合!投稿者に話を聞いた
大谷翔平が不運な判定で2度見逃し三振 「えん罪退場」で話題の球審は引き揚げる大谷にブチギレ
玉置浩二の妻、青田典子(53)の現在がとんでもない事になっていると話題に
吉野家が「マスク外し強要疑惑」でプチ炎上、店員さんに聞いてみると……
マンション刺殺、被害者は19歳大学生の女性 大阪・枚方
元めちゃイケメンバーの三中元克(32)現在は何をしているのか調べてみた!
藤田ニコル「脱ぐ予定なかったのですが気づいたらノリノリで…」ヒョウ柄水着姿に大反響
3度逮捕の38歳小向美奈子「今はやってないですよね?」の直撃質問に”回答”
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
東国原英夫氏、近隣アイドルの部屋に「俳優さんたちが入れ替わり立ち替わり…」
何があった!?「エアコン」が想定外の壊れ具合!投稿者に話を聞いた
岡本夏生(56)、1600日ぶりにブログを更新した現在が衝撃
玉置浩二の妻、青田典子(53)の現在がとんでもない事になっていると話題に
ユーチューバーもこう氏、元彼女・成海瑠奈について赤裸々告白
ヒカル、浮気相手とのLINE流出にドン引きの声「キモすぎる」「吐きそう」
元めちゃイケメンバーの三中元克(32)現在は何をしているのか調べてみた!
ガーシー、またも綾野剛の暴露写真でネット歓喜「この写真見て笑っちゃう」
完全にダマされた! 『ラヴィット!』あのちゃん“事故レベル”大暴走は『水ダウ』遠隔操作のしわざだった ネットも納得
大谷翔平が不運な判定で2度見逃し三振 「えん罪退場」で話題の球審は引き揚げる大谷にブチギレ
73歳神田正輝「旅サラダ」生放送で“12歳下俳優”から呼び捨てされ激論
市村正親の16歳イケメン長男市村優汰、色気漂う”赤髪”ヘア公開し騒然「大物感がすごい」
【阪神】梅野隆太郎が今度は異例すぎる「膝ブロック」で窮地救う 走者進塁防いでリード保つ
「奇跡の…」「年々可愛く」55歳森高千里”超ミニ”驚異の美ボディーにネット騒然
【日本ハム】伊藤大海7回3失点降板で今季初黒星の危機も…打線が8回に執念で追いつき無傷継続
73歳岩城滉一「いつまでもこれで食っていけると思えない」 俳優業達観も副業の税高騰にぼやき
南部虎弾さん18歳下の妻「生涯現役貫いてやってくれた。それが自慢の旦那」19年には腎臓提供
【ソフトバンク】山川穂高が死球交代、アブレイユの157キロ左手直撃「骨のところ」監督も心配
73歳岩城滉一「指ちぎったのと足首クルッと回ったくらい」バイク壮絶けがも「今度レース出る」
GLAY・TERU「今でも仲良く遊び仲間。普通にご飯も一緒に」メンバーとの関係に言及
センバツ王者・健大高崎が5回コールド好発進 先発の下重賢慎が3回を8連続三振で無安打無失点