ai2026/6/23 13:00:00

大規模言語モデルを用いた特定ドメインオントロジー構築

ニュース概要

オントロジーは、人間とシステムの両方が理解できる情報を整理・維持するための有用な構造です。しかし、手作業での作成は労力がかかるため、多くの特定ドメインでは参照オントロジーが不足しています。大規模言語モデル（LLM）が示す自然言語理解の優れた能力は、オントロジー開発を含む様々な分野での活用を促進しています。本稿では、LLMをドメインエキスパートとして利用し、与えられた初期概念のための概念階層を構築する技術の実験について紹介します。GPT-3.5とGPT-4を使用して自動構築されたブラジル海上領土（別名ブルーアマゾン）ドメインの20個のオントロジーを、人間の専門家が評価しました。モデルはドメインの全体的に首尾一貫した概念化を構築できましたが、どの出力も調整なしでは文脈の表現として完全に満足できるものではありませんでした。

解説

皆さんは「オントロジー」という言葉を聞いたことがありますか？ちょっと難しそうに聞こえるかもしれませんが、これは、人間もコンピューターも、ある分野の情報をきちんと理解し、整理するために使う「情報の地図」のようなものです。例えば、医療の分野なら病気や薬、治療法といった情報を、きちんと整理しておかないと、お医者さんもコンピューターも混乱してしまいますよね。こうした情報の地図作りは、専門家が一つ一つ手作業で行うことが多く、時間も手間もかかります。そのため、特定の分野では、こうした「情報の地図」が十分に用意されていないのが現状です。

そこで注目されているのが、最近めきめきと賢くなっているAI、特に「大規模言語モデル（LLM）」です。LLMは、まるで人間のように文章を理解したり、作り出したりするのが得意ですよね。この賢さを、情報の地図作り、つまりオントロジー作りに活かそうという研究が進んでいます。今回ご紹介する研究では、LLMを「その分野の専門家」に見立てて、新しい情報の地図を自動で作れるか実験しました。具体的には、ブラジルが持つ広大な海上の領土（「ブルーアマゾン」とも呼ばれています）を題材に、GPT-3.5とGPT-4という2つのAIを使って20個の情報の地図を作ってみたんです。

そして、作った地図を人間の専門家に見てもらったところ、AIは全体としてまとまりのある情報の地図を作れることが分かりました。しかし、AIが作った地図は、そのままでは文脈にぴったり合っているとは言えず、人間の専門家による「微調整」がまだ必要だという結果になったのです。つまり、AIは「たたき台」としては優秀だけれど、最終的な仕上げは人間にお任せ、という状況のようです。AIの進化は目覚ましいですが、専門知識が深く関わる分野では、まだまだ人間との協力が不可欠なんですね。

今後の予測

今回の研究結果からは、LLMがオントロジー構築の初期段階で強力なアシスタントになりうる可能性が見えてきました。今後、LLMの能力がさらに向上すれば、より複雑で専門的なドメインのオントロジー構築も、より迅速かつ効率的に行えるようになるかもしれません。例えば、医療や法律、金融といった高度な専門知識が求められる分野で、AIが専門家と協力しながら、最新の情報に基づいた精度の高いオントロジーを継続的に更新していく、といった未来が考えられます。一方で、AIが生成した情報の正確性や、文脈への適合性をどう担保するかが引き続き課題となるでしょう。人間による最終確認や修正のプロセスは、しばらくの間、不可欠なものとして残る可能性が高いです。AIがどこまで自律的に、かつ正確にオントロジーを構築できるようになるのか、その進化のスピードが注目されます。