AIを活用したニュース記事の自動要約における実証実験を実施
日本テレビ放送網株式会社 株式株式会社NTTドコモ
AIを活用したニュース記事の自動要約における実証実験を実施
~実用化に向け、自動要約システムのプロトタイプを開発~
日本テレビ放送網株式会社(以下、日本テレビ)と、株式会社NTTドコモ(以下、ドコモ)は、AIを活用したニュース記事の自動要約システム(以下、本システム)の実用化をめざす実証実験(以下、本実証実験)を行い、WEB用ニュース記事の要約作業を自動化するシステムのプロトタイプを開発しました。今後実用化をめざし、日本テレビ内にて現場担当者による事前の性能テストを行います。
ドコモは2016年より、AIを活用した本システムの研究開発に着手しており、文章の中から重要度の高い文章をAIが判定して抜粋したり、AIが言葉を補いながら新たに文を生成して要約したりする本システムを作成していました。
両者は2018年9月から、日本テレビが大量に保有する20万件近い過去記事データと人が要約したデータセットを本システムに学習させ、要約の精度向上に取り組むとともに、2019年5月から開始した本実証実験では、本システムの機能拡充やインターフェースの実装を行い、現場で使用するためのWEBアプリケーション型のプロトタイプを開発しました。
今回の機能拡充においては、日本テレビの原稿制作ノウハウをルールベースで実装するとともに、タイトルに含まれる単語やユーザーが指定した任意の単語の重要度を向上させ要約結果に反映する機能や、要約後の単語が要約前文章のどの部分で出現しているかをトレースできる機能など、現場の声を反映したアイデアを追加実装しています。
本システムの基盤となる技術には、NTTドコモ北京研究所(以下、北京研)の自動要約技術を用いています。本要約技術は、北京研がAI技術を用いて独自に開発したニューラルネットワーク(DNN:Deep Neural Networks)※1により実現されており、既存技術と比較して重要情報の網羅性を高めただけでなく、必要な接続詞などを選択・生成することにより読みやすい文章を生成します。
なお、本実証実験で開発したプロトタイプについて、2020年1月23日(木)~24日(金)に開催するドコモのイベント「DOCOMO Open House 2020」のAI展示ブースにて、実際にデモをご体感いただけます。
両社は今後現場での検証を通じてさらなる要約精度の向上を図り、本システムの実用化をめざしてまいります。
※1 ニューラルネットワーク:人間の脳の仕組みを模したAIの計算モデル手法のこと。
別紙
実証実験概要
■ 背景
日本テレビが運営するニュース専門サイト「日テレNEWS24」では、最新のニュースを動画とニュース原稿(全文記事と要約記事)で配信しており、特に要約記事をサイト上に表示することにより読者にニュース概要を分かりやすく伝えています。一方で、このニュース記事の要約作業には人手による要約の手間が発生しています。また、要約作業には熟練したスキルが必要であるため、スタッフの育成に一定期間の研修が必要で、人員の確保も課題となっています。
■ 本システムの概要
本システムは、要約手法の異なる「抽出式要約システム」と「生成式要約システム」の2つの自動要約システムに大別され、各々についてプロトタイプを開発しました。
1.抽出式要約システム
抽出式では、全文原稿から重要度の高い文を抜き出して要約します。
<基本機能>
・ AIを用いた文書要約機能
・ 要約元の全文原稿から、文単位でそのまま文章を抽出し、要約結果として表示
◆通常の抽出式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O1-tIir7j67 】
<追加機能>
・ 要約元原稿のニュース記事のタイトルやユーザーが指定した任意の単語を重要語とし判定し、要約結果に反映する機能
・ 要約結果が要約元原稿のどの文章から抽出されたのかをトレースする機能
・ あらかじめ設定した上限文字数内で要約を生成する機能
◆ヒントありの抽出式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O2-90oT4eb7 】
→人間が全文テキストの中から任意の重要部分を選択した場合、その重要部分が含まれる文を優先的に抽出することで、重要部分が必ず要約テキストに含まれるようにします。
2.生成式要約システム
生成式では、全文原稿からの抽出だけでなく、言葉を補いながら新たに文を生成して要約します。
<基本機能>
・ AIを用いた文書要約機能
・ 要約元の全文原稿を参考に、重要な文を抜き出して新たな文書を生成
◆通常の生成式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O3-6IK4NX22 】
<追加機能>
・ 要約元原稿のニュース記事のタイトルやユーザーが指定した任意の単語を重要語として判定し、要約結果に反映する機能
・ 要約結果が要約元原稿のどの文章から生成されたのかをトレースする機能
・ あらかじめ設定した上限文字数内で要約を生成する機能
・ 起承転結を考え、必要な接続詞などを選択・生成する機能
◆ヒントありの生成式自動要約
【画像: https://kyodonewsprwire.jp/img/202001215880-O4-j7TXp9F2 】
→人間が全文テキストの中から任意の重要部分を選択した場合、その重要部分に含まれる単語が必ず要約テキストに含まれるようにするとともに、その前後の文脈的に必要な部分の重要度を高め、結果的に要約文に含まれやすいようにします。
人気歌手luzさん急逝 2週間前に最後のSNS投稿「本当に全てに限界来てる」
楽天トラベル、「月末SALE」開催 9月1日まで
「美人ママですね」鮫島彩さんが出産したばかりの赤ちゃんと2ショット 6月に結婚&出産を報告
双子妊娠の中川翔子、AIで予想図生成 キュートな双子の図に「わたし成分しか入ってないけど」
アグネス・チャン誕生日、ツヤ肌光る近影にファン感嘆「キラキラ笑顔」「70才には見えない」
【ロピアのチラシ】8月25日までの目玉商品!先着100名限定の98円均一セール&豪華賞品が当たるお祭りイベント開催中!
アラブ首長国連邦ラス・アル・ハイマは、中東で最も急成長する不動産市場の1つであると業界リーダーたちが確信
【DeNA】快速美女が今日も激走 今季限りで卒業「diana」 AKiがバースデーラン制す
「オルタナティブステレオ」からペンダントリップのベルベットラインが新登場
キャッシュレス決済が浸透も、世代で差 Y世代はセキュリティに不安
細木数子さんに「うるせーな、クソババア!」暴言吐いた62歳女性芸人「上から言われたので…」
<1分で解説>福山雅治さん、フジ「不適切会合」への出席認める
大谷翔平、2年連続50本塁打ならとてつもない偉業 投手有利な本拠地球場&投打二刀流に価値
マギー、黒ビキニ姿の自撮りショット披露に反響「現地調達も」
元「NHKの峰不二子」が独立5カ月で初グラビア挑戦「どきどき」にX歓喜「こちらもドキドキ」
人気歌手luzさん急逝 2週間前に最後のSNS投稿「本当に全てに限界来てる」
笑福亭鶴瓶、南青山のマンション“衝撃の家賃”を告白「タモリさんに“バカじゃないの”って」
夫急死の小島瑠璃子、子どもとのショットに反響「何故か涙が」「がんばれママ」
36歳金髪女性タレントのタトゥー姿に騒然!?「よく見たら」「ババシャツか」Xツッコミ殺到
有吉弘行「腹立つわ」赤裸々告白「国宝」初鑑賞で〝クソ客〟遭遇「ラブシーン始まって興奮して…」
二階堂ふみが結婚!?お相手が衝撃的過ぎてネット民「マジか・・・」
新幹線“キセル乗車” 驚がくの手口とは
オードリー若林結婚で嫁の名前がソッコーで特定する動き始まる
水卜麻美アナ、生放送で突如号泣 スタジオ騒然 大粒の涙ボロボロこぼし「ごめんなさい…」
【おすすめアニメ50選】完結済み!定番から最新作まで!
大谷翔平と代理人バレロ氏が訴えられる、ハワイの高級リゾート住宅建設プロジェクトを巡り
二階堂ふみとカズレーザーが結婚を発表
あのちゃんが実名告白「もっと笑顔にしたい」38歳元アナ女優「めっちゃ暗い、何かたまってる」
小澤征悦と再婚した桑子真帆アナ(34)黒い過去が流出、衝撃の過去にネット騒然
サンモニ膳場貴子が「失言生謝罪」の青木理氏に“17文字”でコメント

人気歌手luzさん急逝 2週間前に最後のSNS投稿「本当に全てに限界来てる」
楽天トラベル、「月末SALE」開催 9月1日まで
「美人ママですね」鮫島彩さんが出産したばかりの赤ちゃんと2ショット 6月に結婚&出産を報告
双子妊娠の中川翔子、AIで予想図生成 キュートな双子の図に「わたし成分しか入ってないけど」
アグネス・チャン誕生日、ツヤ肌光る近影にファン感嘆「キラキラ笑顔」「70才には見えない」
【ロピアのチラシ】8月25日までの目玉商品!先着100名限定の98円均一セール&豪華賞品が当たるお祭りイベント開催中!
【DeNA】快速美女が今日も激走 今季限りで卒業「diana」 AKiがバースデーラン制す
アラブ首長国連邦ラス・アル・ハイマは、中東で最も急成長する不動産市場の1つであると業界リーダーたちが確信
「オルタナティブステレオ」からペンダントリップのベルベットラインが新登場
キャッシュレス決済が浸透も、世代で差 Y世代はセキュリティに不安