図1) T-tact AN-ZINのPDF翻訳イメージ図
図2) PDF翻訳の使用画面
また、日本語から直接翻訳できる言語ペアを追加しました。2月にはIT分野に特化したエンジンをリリース予定です。
■PDF翻訳機能について
AI翻訳システムでは通常、テキスト抽出ができるPDFのみテキスト部分を抽出して翻訳してきました。その際、PDFの行末には不要な改行が入るため、翻訳の精度が非常に落ちていました。
T-tact AN-ZINのPDF翻訳機能では、不要な改行を削除した形で一旦Wordファイルに変換し、その後翻訳を行います*1。テキストが抽出できないスキャンデータでも文字の部分をOCR機能でテキストデータに変換し、翻訳を行います。そのため、画像に入っている文字も翻訳が可能です。
*1:ファイルによっては改行削除などのレイアウトを保持できない場合もあります。
画像1: https://www.atpress.ne.jp/releases/203781/LL_img_203781_1.jpg
図1) T-tact AN-ZINのPDF翻訳イメージ図
* 8MB以内のファイルに限ります。
* 2,000文までの翻訳に限ります。2,000文を超える場合は、Wordへの変換のみ行われますので、2,000文以内に収まるようにファイルを分割し、再度翻訳にかけてください。
* OCR機能は30ページ以内に限ります。
■簡単な操作でPDF翻訳が可能
簡単な操作で使用できます。翻訳したいファイルを選択して、OCR機能を使用するかしないかを設定するだけで、Wordファイルに変換された翻訳済のファイルをダウンロードすることができます。OCRを「使用する」に設定していれば、画像の中の文字列もテキスト化して翻訳します。
画像2: https://www.atpress.ne.jp/releases/203781/LL_img_203781_2.png
図2) PDF翻訳の使用画面
■日本語から直接翻訳できる言語の追加
今まで日本語から直接翻訳できるのは、英語・中国語簡体字・中国語繁体字・韓国語に限られていましたが、2020年1月14日より、以下の8言語ペアが使用可能になりました。今後も順次言語ペアを追加していきます。
日本語⇔フランス語
日本語⇔ドイツ語
日本語⇔スペイン語
日本語⇔ポルトガル語
日本語⇔タイ語
日本語⇔ベトナム語
日本語⇔インドネシア語
日本語⇔ミャンマー語
■用途に合わせた分野ごとの専用エンジンにITエンジンを追加
ある分野の対訳集を使ってエンジンの深層学習を行うことで、その分野の訳文の精度を上げることができます。その技術を使用して、当社が独自に収集した対訳集でAI学習(アダプテーション)させた分野ごとのエンジンを作成しています。すでに「汎用エンジン」、「特許エンジン」、「特許請求項エンジン」に加えて、AI学習させて作成した「半導体エンジン」をリリースしております。2020年2月にはIT分野に特化したITエンジンをリリース予定です。今後も、各分野に特化したエンジンを搭載していく予定です。
また、この技術を使用することで、分野ごとだけではなく、企業ごとのエンジンを作成することも可能です。ご要望の際はご相談ください。
■T-tact AN-ZINとは
NICTでは総務省と共に翻訳データを収集し機械翻訳エンジンの精度を高めるためのプロジェクト(翻訳バンクプロジェクト)に取り組んでおり、さまざまな企業からの翻訳データを収集することにより日増しにその精度を高めています。
十印でも、この翻訳バンクプロジェクトに賛同し、独自に作成した対訳データを提供することで機械翻訳エンジンの品質向上に協力しています。T-tact AN-ZINは、NICTからの技術提供を受け、簡単な手続、かつ低価格でビジネスに利用できるようにしたものです。
高いセキュリティ、豊富な便利機能、高精度の翻訳で、ビジネス翻訳に関わる時間を劇的に短縮します。
T-tact AN-ZINの詳細については以下をご参照ください。
よくある質問 https://to-in.com/lp
サービスの概要 https://to-in.com/service/mt/an-zin
2週間の無料トライアルを実施しています。ご希望の方は「 mt-strategies@to-in.co.jp 」まで件名に「トライアル希望」としてメールをお送りください。折り返しトライアル登録情報をお送りします。
月額料金の詳細は以下を参照してください。
https://to-in.com/service/mt/an-zin
お客さまの使用状況に応じて最適なプランを設定いたしますので、まずはご相談ください。
■問い合わせ先
メール : mt-strategies@to-in.co.jp
電話番号: 03-6453-6285
担当 : MT事業部 AN-ZIN担当まで
受付時間: 9:00~18:00(月~金:日本時間)
■株式会社十印について
株式会社十印は、1963年より半世紀にわたり企業向けのドキュメント制作に携わってきました。技術文書の翻訳からスタートし、時代の変化と、お客様のニーズにいち早く対応しながら成長し、現在ではIT分野のローカライズで高い実績を誇り、「ローカリゼーションの十印」として認知されています。
1980年代からは、「言語研究所」を設立し、日本初の機械翻訳プロジェクトMu プロジェクトに関わってきました。
一般社団法人日本翻訳連盟の立ち上げにも関わり、長く会長を務め日本の産業翻訳の発展に貢献してきました。独自の厳正なトライアルを合格した登録翻訳者数は3,000名を超え、IT分野にとどまらず、半導体、自動車、医療・医薬、ビジネス一般、金融など広い分野に対応しています。
2019年2月、金融商品取引法・会社法等のディスクロージャー及びIR関連の翻訳等を行う宝印刷株式会社の100%子会社となりました。
現在は、米国・中国・韓国にもネットワークを持ち、海外のお客様との取引も多く行っています。
【株式会社十印(日本本社)】
所在地 : 〒108-0014 東京都港区芝5丁目31番19号 ラウンドクロス田町7階
代表者 : 代表取締役会長 岡田 竜介
事業内容: 1)翻訳、ローカリゼーション、2)MT翻訳サービス、3)通訳派遣
資本金 : 9,998万円
従業員数: 約80名
電話番号: 03-6453-6285(代表)
URL : http://www.to-in.com
■国立研究開発法人情報通信研究機構(NICT)について
情報通信研究機構(NICT: National Institute of Information and Communications Technology)は、情報通信分野を専門とした公的研究機関で、情報通信技術(ICT)の研究開発を推進するとともに、情報通信事業の振興業務を実施しています。
NICTの開発した機械翻訳エンジンは、国内でも高い水準の翻訳品質を提供しています。
【国立研究開発法人情報通信研究機構(本部)】
所在地 : 〒184-8795 東京都小金井市貫井北町4-2-1
代表者 : 理事長 徳田 英幸
電話番号: 042-327-7429(代表)
URL : https://www.nict.go.jp/