AIの進化は目覚ましく、日常的にさまざまな場所で活用されています。
最近はディープラーニングという、大量のデータから機械が特徴を見出す技術が発展し、機械が人間のように認知や区別ができるようになってきました。
ディープラーニングを活用し、まるで人間と話しているように自然に会話ができたり、お題に合ったイラストを描いたりできるソフトウェアも誕生しています。
以前はAIを使いこなすのは大学での研究が主でしたが、技術の発展により実用化が進み、知識が無い人もAI利用するようになっています。
新しい技術の発展が、より便利なサービスを生み出し、今までよりも新しく暮らしやすい世の中になっていくかもしれません。
しかし、AIの技術発展は人間にとってプラスになるだけではありません。
AIから作られた人工的な画像や映像を使って、人を騙そうとする人も出てきています。
騙されないためには本物か偽物か見分ける眼力が必要ですが、人間がわずかな特徴を見出し偽物かどうか判断することは極めて難しいでしょう。
そこで、国立情報学研究所(NII)は本物なのか、AIが作ったものなのか見分けるためのプログラムを開発しています。
この技術は2023年に国内で初めて実用化されることになりました。
目次
- AI普及のメリットと弊害
- フェイク顔映像を自動判別するプログラム「SYNTHETIQ VISION」
AI普及のメリットと弊害
まるで人間と話しているように自然な文章でやり取りができるChatGPTや、指示通りの画像や映像を作り出すソフトウェアなど、AIはさまざまな分野で活用されるようになりました。
その中で、リアルな音声付きの映像を作り出す動画合成技術のことを「シンセティック・メディア」と呼び、ニュースの読み上げなどで活用されています。
シンセティック・メディアを使えば、合成される人を直接撮影することなく、その人がまるで話しているような映像を作り出すことが可能です。
機械を使用すれば、誤操作や読み間違えなどが無いうえに24時間対応可能で、多言語化も容易にできます。
人間のような動きや話し方を再現しながら人間よりも高度な対応ができ、ニュースだけではなくさまざまな場面で活用されていくでしょう。
シンセティック・メディアは便利で将来性が高い技術ではありますが、「ディープフェイク」による悪用につながる懸念点があります。
ディープフェイクを使用した犯罪や嫌がらせ
AIによる作り出した、フェイク動画や画像を「ディープフェイク」と呼びます。
以前、SNSでファッショナブルな白いダウンコートを着たローマ教皇の画像が話題となりました。
とてもローマ教皇が着ているものとは思えず、そのギャップに人々は興味をひいたのです。
しかし、このローマ教皇の画像はディープフェイクによる偽物だったのです。
かなりリアルな画像であったことから騙される人が続出しました。
また、ウクライナのゼレンスキー大統領がロシアに降伏すると宣言する動画が投稿されたこともありました。
すぐにウクライナ側が気が付き削除対応と偽動画であることの表明が行われ、大事には至りませんでした。
しかし、このような使われ方をすれば、ディープフェイクにより政治的に大きな曲面に影響するほどの事件が起こることも懸念されます。
実際にロンドン大学では、今後起こるAIによる脅威のNo.1は「ディープフェイク」だと発表しています(UCL)。
ディープフェイクは、有名人のフェイク動画を使って誰かを騙したり、その有名人の評判を落としたりすることも可能なのです。
フェイク顔映像を自動判別するプログラム「SYNTHETIQ VISION」
ディープフェイクにより多くの人が被害に遭う可能性があります。
そこで、国立情報学研究所(NII)では、映像が本物か作られたものか真贋判定を行うための「SYNTHETIQ VISION」というプログラムを開発しました。
SYNTHETIQ VISIONは大量のデータを学習したAI(深層学習)により偽物かどうか自動的に識別し、人間による分析を一切必要としません。
深層学習とは、機械がデータを解析し学習することに基づいて判断を行う機械学習の一つです。
深層学習では、上記のように入力層、中間層、出力層の3層に分かれています。
入力層にデータを入力すると、中間層でデータを変換や結合を何度も繰り返し、出力層に送られます。
中間層における層の数が増えれば増えるほど、人間の能力では理解ができないレベルでの高度な分析が可能です。
上図は、中間層により変換や結合が繰り返されている様子を示したものです。
最初は目と口の上の部分だけ赤色となり、そこに機械が注目していることが分かります。
しかし、徐々にデータのどこを注目しているのかぼやけていき、最後のほうはただの青い画像であることしか分かりません。
しかし、機械は細かいデータの差異や規則性を検出できるため、同じような青い画像から特徴を見出すことができるのです。
SYNTHETIQ VISIONも、この深層学習の仕組みを活用しています。
人間にとってはまったく同じに見えるディープフェイクのわずかな差異や規則性を見つけ出し、フェイク動画かどうかを判断します。
SYNTHETIQ VISIONがどのような画像データを覚えさせたのか、どのようなアルゴリズムで真偽を判定するのか、そういったことは現時点(2023年9月)では公開されていません。
ただ、さまざまな画質の映像も学習済みで、圧縮されて画質が落ちた映像でも信頼度の高い判定が可能です。
上記の画像は、右と左のどちらかがフェイクなのですが、どちらがフェイクか分かるでしょうか?
2つ映像はまったく同じような動きで同じように話していますが、映っている人物の顔は異なります。つまり片方は本物の映像で、もう片方はその映像をもとにして別の人物が合成されたフェイク映像ということになります。
何となく映像の解像度に違いはあるように見えますが、どちらも自然な動きをしていて、人の目で正しく判別するのは困難です。
しかし、SYNTHETIQ VISIONを使用すれば、左が本物で右がフェイク映像だと判別できます。
この技術があれば、人間が偽物の映像に振り回されることは無くなります。
また、SYNTHETIQ VISIONの優れている点として、知識のない素人でも操作可能である点があります。
このような技術を実際の映像に適用するためには、ディープラーニングを操作できる知識や技能が必要でした。
しかし、SYNTHETIQ VISIONはサーバーに該当の映像をアップロードするだけで画像や映像の真贋判定が可能です。
これにより、企業や個人が活用しやすくなっています。
サイバーエージェントによる実用化が決定
2023年1月、サイバーエージェントが展開する新サービス「デジタルツインレーベル」で、SYNTHETIQ VISIONを採用することが発表されました。
これは、SYNTHETIQ VISIONが実用化される国内初の事例です。
デジタルツインレーベルとは、著名人の全身の3Dデータ、モーションデータ、音声データを取り込み、まるで分身のようなコンピュータグラフィック「デジタルツイン」を制作するサービスです。
まさにシンセティック・メディアの活用例と言えるでしょう。
デジタルツインでは、まるでその人が動いて話しているような映像を作成できるため、本人の代わりにテレビに出演する、本人と合成映像による共演をする、といった活用方法が可能です。
本来はできない、ダンスや外国語を話すことも可能で、スキルを拡張した表現もできます。
つまり、悪用されると大きな損害が発生するディープフェイクの有効活用といえます。
こういった技術を作り出した以上、悪用を防止することも開発企業の義務といえます。
そこで、サイバーエージェントではディープフェイクによる悪用検知にも積極的に取り組むため、SYNTHETIQ VISIONを採用することになりました。
サイバーエージェントでは、ディープフェイクの悪用を検知し著名人の著作権や肖像権を守ることにより、メディアの信頼性確保や、技術の正しい活用を目指しています。
今後の見通し
シンセティック・メディアを正しく活用されれば、映像として作られる本人の負担減や、本人の分身など目新しい映像開発につながります。
ただ、フェイク映像として悪用されると、本人の評価を下げる動画が公開されたり、多くの人が騙されたりと社会的に大きな問題が発生する恐れがあります。
SYNTHETIQ VISIONなどの技術がどんどん活用され、フェイク映像により人々が振り回されない社会になるとよいですね。
参考文献
AI が生成したフェイク顔映像を自動判定するプログラム「SYNTHETIQ VISION」をタレントの Deepfake 映像検知に採用(PDF)https://www.nii.ac.jp/news/upload/nii_newsrelease_20230113.pdf
シンセティック・メディア AIによるメディア制作の新潮流(PDF)
https://www.nri.com/-/media/Corporate/jp/Files/PDF/knowledge/publication/chitekishisan/2021/07/cs20210702.pdf?la=ja-JP&hash=15E4CE4D3CBF2862FEAD9456D6977C6E156F2F20
人間が深層学習のAIを理解できないのには、理由がある
https://globe.asahi.com/article/12872410
著名人のデジタルツインをキャスティングするサービス「デジタルツインレーベル」を、芸能事務所および著名人向けに開始 「分身」となる公式3DCGモデルを制作・管理し、デジタル空間でのタレント活動を促進へ
https://www.cyberagent.co.jp/news/detail/id=26503