アメリカのデューク大学(Duke)で行われた研究によって、旧約聖書の「書き手のクセ」をAIが統計解析で浮かび上がらせ、3つの「書記グループ」を高精度に判別することに成功しました。
研究では創世記から列王記までの九書(エンネアテウク)から厳選した五十章を対象に、単語の語根頻度と組み合わせパターン──たとえば「いいえ」「どの」「王」といった平凡な語の使い分けだけで84%の正解率を達成しました。
さらに、『サムエル記』に描かれた契約の箱(聖櫃)の物語のように、これまで一続きの物語だと考えられてきた部分も、実際には異なるグループによって書かれている可能性が高いことが示されました。
AIが“言葉の指紋”を手掛かりに三千年越しのゴーストライター探しを進化させたのです。
この手法は聖書だけにとどまらず他の古代文書にも応用可能で、歴史文書研究に新しい道を開くものです。
私たちは聖書の聖書の舞台裏をどこまで解き明かせるのでしょうか?
研究内容の詳細は2025年06月03日に『PLOS ONE』にて発表されました。
目次
- AI が暴いた「言葉のDNA」
- AIが旧約を丸裸!“単語の指紋”で聖書のゴーストライターを特定
- 次は日本書記か?AI×人文学が切り開く著者の正体
AI が暴いた「言葉のDNA」
「聖書は誰が書いたのか」という謎は、200年以上にわたり聖書学者たちを悩ませてきました。
聖書は長い時間をかけて複数の書き手によって執筆・編集されたと広く考えられており、同じ物語が異なる版で組み込まれているケースもあります。
しかし、詳細な文体分析が積み重ねられてきたにもかかわらず、それらの違いを体系的かつ客観的に検証するデータ駆動型の方法はこれまで存在しませんでした。
そこで米デューク大学やイスラエル・ハイファ大学などに所属する国際研究チームが、AI(人工知能)と統計モデルを駆使してこの難問に挑んだのです。
研究チーム(数学者、考古学者、聖書学者、物理学者、計算機科学者などで構成)は、主観的な思い込みや手作業でキーワードを選ぶことなく、計算機によって聖書の文体を客観的に分類できるかを追求しました。
AIが旧約を丸裸!“単語の指紋”で聖書のゴーストライターを特定
まず研究チームは、ヘブライ語聖書最初の9つの書(エンネアテウク)から、資料選定基準(語数が十分・層が単純・学界合意が大きい)を満たした50章を選びました。
この50章はすでに聖書学者の間で「3つの執筆グループ」に分類されているものです。
聖書研究の歴史
伝統的な信仰の世界(ユダヤ教‐ラビ文学や古いキリスト教神学)では、「モーセ五書」は「モーセが五書を一気に書いた」と信じられていました。しかし十九世紀の研究者たちは語り口や神の呼び名が章ごとに微妙に違うことに気づき、「別々の筆者が寄せ集まったのでは」と疑い始めました。たとえばある章では神をヤハウェと呼び、別の章ではエロヒムと呼ぶ。物語に登場する祭りや掟も並び順が食い違う。こうしたズレは、同じ小説を何人もがリレーで書き足していくうち、クセの違いが混ざり込んだように見えました。この発見がウェルハウゼンの資料仮説(J・E・D・P)につながり、「ヤハウェ派」「エロヒム派」「申命記派」「祭司派」という四つの資料が時間差で編集されたという骨格が示されます。二十世紀に入ると考古学が加わり、古代の陶片や碑文が掘り出されたことで、地名や王の年号が本文と照合されました。さらにヘブライ語そのものも変化する“生き物”だとわかり、「この綴りは前七世紀以前には現れない」といった語形のタイムスタンプが年代測定の手がかりになりました。こうして申命記の古層(D)が南ユダの宗教改革が盛んなヨシヤ王時代に書かれ、その後バビロン捕囚で国が滅んだ痛みを反映するかたちで歴史叙述(DtrH)が追加され、最後に帰還した祭司層が礼拝規定を補う祭司資料(P)を編み込んだ、という三段階編集モデルが固まりました。
研究チームは “難しいAI学習” ではなく、単語を数えて比べるだけのシンプルな統計ルールを使いました。
まず各章に登場する単語の「元の形(たとえば “歩く”“歩いた”をまとめて“歩く”と数える)」をすべて数え、よく出てくる単語どうしの組み合わせパターンも記録します。
そのうえで「A という章は “歩く” と “王” が多いタイプ」「B は “契約” と “祭り” が多いタイプ」といった “単語の指紋” を作り、各章がどのグループに属するかを分類させました。
「3つの執筆グループ」とは以下の通りです:
①申命記グループ(D) – 『申命記』に含まれる最古層の文書群(紀元前 630〜610 年ごろ)
②申命記史家グループ(DtrH) – 『ヨシュア記』から『列王記』までの歴史書(申命記史書)を編纂した文書群(紀元前 560 年ごろ)
③祭司グループ(P) – 『創世記』17章、『出エジプト記』25–31章、『レビ記』1–9章など祭司階級に属する著者たちによって書かれた文書群(前 540〜450 年ごろ)
テストの結果、AIモデルは分析対象の50章のうち、分類可能だった49章についておよそ84%の正解率で執筆グループを判別しました。
この数字は、これまでの研究で得られている精度とほぼ同じで、十分に信頼できるレベルだと言えます。
分析によれば、申命記グループ(D)と申命記史家グループ(DtrH)の文体は互いに非常によく似ており、祭司グループ(P)とは大きく異なることも明らかになりました。
この傾向は「申命記や歴史書を担った書き手グループは祭司文書の書き手と比べてお互い近い関係にある」という従来の聖書学の見解と一致しています。
特筆すべきは、文体の違いがごく基本的な語彙の使い方にまで現れていた点です。
例えば「いいえ」「どの」「王」といった一見ありふれた単語でさえ、グループごとに登場頻度や用法に差が認められました。
研究者たちは「各グループの書き手はそれぞれ異なる言語上の指紋(フィンガープリント)を持っていました。『いいえ』『どの』『王』のような単純で一般的な単語でさえもです。
われわれの開発した手法はそうした違いを精密に検出できます」と述べています。
最初の検証でモデルの有効性を示した後、チームは次にこのAIモデルを「著者が議論となっている」聖書の章へ適用しました。
代表的な例が、『サムエル記』上・下にまたがる「契約の箱」の物語です。
ダビデ王が聖櫃(契約の箱)を都エルサレムに運ぶこの物語について、多くの学者は長らく単一の筆者による連続した記述だと考えてきました。
しかしAIによる分析は異なる結果を示しました。
『サムエル記』の契約の箱物語を調べると、サムエル記下6章は申命記史家グループ(DtrH)の“書き手のクセ”と強く一致し、AI が示した一致度は 0.84(84 %)でした。
いっぽうサムエル記上4章の対応部分は、3つのどのグループともはっきり重ならないという結果になりました。
この発見は、両者は別々の作者による可能性が高いことを意味します。
実際、一部の聖書学者は以前から『この物語は異なる出典を繋ぎ合わせたものではないか』という複数著者説を提起していましたが、今回の結果はその見解を裏付ける客観的証拠と言えるでしょう。
上記の他にも、研究チームは旧約聖書内で著者がはっきりしない様々な箇所にモデルを適用しています。
たとえば『エステル記』、『箴言』の幾つかの章、『創世記』の族長物語(アブラハムやヤコブに関する部分)、『歴代誌』の一部などです。
モデルは各テキストの単語や表現パターンを分析し、3つの既知グループのうちどのスタイルに最も近いかを判定しました。
さらにこのモデルには興味深い特徴があります。ブラックボックス型ではなく、判定根拠となる語や表現を明示的に抽出し、研究者がその判断根拠を解釈できるようになっているのです。
アルオン・キプニス博士(イスラエル・ライヒマン大学)も「この手法の大きな利点の一つは、分析結果を説明できることです。すなわち、ある章が特定の文体グループに分類された理由となった単語や表現を特定できるのです」と述べています。
AIがブラックボックスにならず、「なぜそう分類したか」を示せる点は、人文学の研究手法としても重要です。
もちろん、古代の文書を分析する上で課題もありました。
テキストの中にはごく短い断片しか残っていない場合が多いため、通常の機械学習では十分な学習データを確保できません。
研究チームはそこで大量の訓練データを必要としないカスタムAIモデルを開発しました。
具体的には各章の文の構造や単語(語根)の出現頻度を直接比較する、シンプルで直接的な統計手法を採用したのです。
このアプローチにより、数節程度の短い章であっても信頼性のある分類が可能になりました。
事実、最も短いテキストでは約10節程度しかありませんでしたが、それでも約80%の正解率で正しいグループに割り当てられたと報告されています。
次は日本書記か?AI×人文学が切り開く著者の正体
今回の研究によって、聖書の著者に関する長年の議論に客観的な証拠がもたらされました。
申命記系の文書と祭司文書の違いが定量的に示されたことは、従来の聖書学の知見をデータで裏付ける成果です。
また、『サムエル記』における聖櫃物語の分析結果は、テキストの成り立ちに関する新たな洞察を提供しました。
機械が示した結論は、人間の解釈だけでは得られなかった視点を加えうることを示しています。
研究者らは「本手法の主目的は、不明瞭だった執筆者集団ごとの言語・文化的特徴を再構築することにある」と強調しています。
聖書は数世紀にわたり様々な時代・場所で書き継がれてきたため、グループごとの特徴が明らかになれば聖書テキストの成立過程をより深く理解できるでしょう。
さらに今回開発された手法は、聖書以外の古代文書にも応用可能です。
例えば歴史上の人物が残した文書の真贋判定にも役立つかもしれません。
この技術を使えば日本の古い文献の分析についても、AIの目を利用できるようになるかもしれません。
研究を主導したシラ・ファイゲンバウム・ゴロヴィン助教(デューク大学)は「もしリンカーン大統領が書いたとされる文書の断片が見つかったとして、それが本物か偽物かを調べるのにもこの手法が役立つでしょう」と述べています。
実際、研究チームは今後死海文書など他の古代文献にもこの方法を適用し、新たな発見につなげたいとしています。
将来的には古代ギリシャ・ローマの古典やシェイクスピア作品など、他の歴史的文献への応用も期待されています。
ハイファ大学のイスラエル・フィンケルシュタイン教授は「この研究は古代文書を分析する新たなパラダイム(枠組み)を提示するものだ」と評価しています。
実際、本研究はデジタル人文学と呼ばれる分野における一大マイルストーンとも言えるでしょう。
自然科学系と人文系の研究者が力を合わせることで、人類の文化遺産をデータに基づき分析するという新しいアプローチが現実のものとなりました。
共同研究に参加したファイゲンバウム・ゴロヴィン助教は「科学と人文学の間の独特な協働です。驚くべき共生関係で、学問の境界を押し広げる革新的な研究に関われて幸運です」と語っています。
古代の知恵と最新AI技術の出会いが、生きた歴史をさらに深く読み解く鍵となりつつあります。
科学の目で読み直すことで、聖書という人類共有の遺産に新たな光が当てられ始めました。
これからもAIは人文学の強力な相棒となり、過去から未来への架け橋となる発見をもたらしてくれるでしょう。
元論文
Critical biblical studies via word frequency analysis: Unveiling text authorship
https://doi.org/10.1371/journal.pone.0322905
ライター
川勝康弘: ナゾロジー副編集長。 大学で研究生活を送ること10年と少し。 小説家としての活動履歴あり。 専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。 日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。 夢は最新科学をまとめて小学生用に本にすること。
編集者
ナゾロジー 編集部