英語や日本語などの自然言語で質問を投げかけると、流ちょうな文章で回答してくれる大規模言語モデル(LLM)が、話題を席巻している。建築設計者や建設技術者の仕事にも、大きなインパクトをもたらし得る技術だ。筆者はLLMを搭載した対話型AI(人工知能)のChatGPTやBingAI、Bardで、2022年の1級建築士「学科試験」に挑戦し、現状の実力を検証してみた。合否はいかに――。
1級建築士は、構造や用途、規模を問わず建築物の設計と工事監理ができる業務独占資格だ。合格率は10%程度の難関国家資格で、建築設計者として幅広い仕事を手掛けるには取得が欠かせない。合格には、4択問題の「学科試験」をクリアした後、課題に応じた建物を設計して図面を手描きで作製する「製図試験」を通過する必要がある。対話型AIは単独だと作図ができないため、今回は「学科試験」を解かせることにした。学科試験のみの合格率は15~20%程度だ。
学科試験は学科1(計画)と学科2(環境・設備)が各20問、学科3(法規)と学科4(構造)が各30問、学科5(施工)が25問の計125問。1問を1点とカウントするので、満点は125点だ。22年の学科試験の場合、合格には各科目で過半の得点を、総得点は91点を取る必要があった。正答率72.8%が合格の条件だ。
なお、22年の学科試験には、学科4を中心に図を読み取って答える問題が計15問ある。ChatGPTなどは検証時点で画像入力に対応していないため、こうした問題を除く計110問の正答率を算出し、実力を検証することにした。
早速、結果を示そう。米OpenAI(オープンAI)のChatGPTの正答率は47.3%。合格基準の72.8%には及ばなかった。ただし、3つの対話型AIでは最も正答率が高かった。検証は23年4月末に実施。23年3月から有償での一般提供が始まった「GPT-4」を用いた。この時点では、インターネットを参照して回答する「ウェブブラウジング機能」や各種プラグインは提供されていなかったため、使用していない。
米Microsoft(マイクロソフト)が23年2月に同社の検索エンジン「Bing」に追加したAIチャット機能(BingAI)、米Google(グーグル)が23年5月に日本語版を公開した対話型AIの「Bard」についても5月初旬に検証したところ、正答率はBingAIが34.5%、Bardが27.3%でいずれもChatGPT (GPT-4) を下回った。
BingAIはGPT-4を採用しており、さらには最新の検索結果を反映した回答が可能だ。しかし、正答率はChatGPT (GPT-4)を大きく下回った。理由は不明だ。Bardは米Googleの大規模言語モデル「PaLM 2」をベースにしたサービス。今回の検証では、正答率が最も低かった。
ChatGPT だけが「建基法は最低基準」と正しく答えた
学科試験は上述のように、学科1~5から成る。学科1は「計画」。住宅から街づくりまで、建築計画に関する幅広い知識を問うのが特徴だ。最初の問題は、1~4の選択肢から1つだけ「最も不適当なもの」を選ぶ、オーソドックスな形式。具体的には、以下のような問題だった。
次の記述のうち、最も不適当なものはどれか。
1.建築士は、他人の求めに応じ報酬を得て、建築物の建築に関する法令に基づく手続きの代理を行う場合、建築士事務所に所属する必要がある。
2.建築士は、設計契約を結んだ委任者に対し、法律に定められていない内容であっても、建築士として一般的に要求されるだけの注意を尽くす義務がある。
3.建築基準法は、国民の生命、健康及び財産の保護を図り、公共の福祉の増進に資することを目的として、建築物の敷地、構造、設備及び用途に関する平均的な基準を定めている。
4.我が国において2050年までのカーボンニュートラルの実現のために、建築物においては、省エネルギー性能の確保や向上への取り組み、また、再生可能エネルギーの導入拡大等が求められている。
正解は3だ。建築基準法は「平均的な基準」ではなく「最低基準」を定めるものであり、このことは同法1条に明記されている。1級建築士を目指すのであれば、常識中の常識。必ず正解したい問題だ。ChatGPT (GPT-4)は数秒かけて「3」と回答。見事正解した。理由についても建基法が「最低基準」であることを指摘しており、パーフェクトな解答といえるだろう。