最新生成AIが東大・京大合格者最高点を超えた驚愕の検証
株式会社LifePrompt(東京都新宿区)は、生成AIに関する最新の興味深い検証結果を発表しました。この検証では、2026年2月に行われた東京大学と京都大学の二次試験問題を、生成AI「ChatGPT 5.2 Thinking」「Gemini 3 Pro Preview」「Claude 4.5 Opus」に解答させ、その結果を比較しました。河合塾の講師と株式会社KIESの協力を得て行われたこの検証では、各AIが驚異的な結果を出し、特に数学では満点を獲得するという快挙を成し遂げています。
検証結果の概要
この検証の中で特に目を見張るのが、東京大学の理科三類(550点満点)において、ChatGPTが503.59点、Gemini 3 Proが496.54点という高得点をマークした点です。これに対し、2026年度の理科三類の合格者最高点は453.60点。AIたちはこの最高点を大幅に上回る結果となりました。
また、京都大学の医学部医学科(1275点満点)でも、ChatGPTが1176.38点、Geminiが1122.75点を記録し、合格者最高点1098.25点を超えました。このように、生成AIたちが日本の難関大学の入試問題において、あっさりと合格者の最高得点を超えたのです。
満点を記録した科目
中でも注目すべきは、両大学の数学における結果です。東京大学の理系数学で120点満点を取ったのはChatGPTとGeminiであり、文系数学でもChatGPTが満点を獲得しました。さらに、京都大学の理系数学でも両AIが満点を出しており、その圧倒的なパフォーマンスが伺えます。
昨年との比較
昨年行われた検証では、東大理系数学のスコアはわずか38点だったことを考えると、わずか1年で満点に達したことが驚異的です。この急速な進化は、生成AIの推論能力の飛躍的な向上を示しています。AIは一体どこまで能力を高めることができるのか、今後の展開にも期待が高まります。
公平な検証手法
検証を行うにあたり、LifePromptが独自に開発した自動受験システムを用いて、入試問題を画像化し、各AIモデルに送信しました。ここでのポイントは、AI同士のやり取りは直接行い、結果を人為的な干渉から完全に解放したことです。この方法により、AIの純粋な能力が評価されています。
河合塾講師による評価
採点には河合塾の講師も関与し、AIの実力とその弱点について鋭い分析が行われました。一部の講師は、特にChatGPTの解答力に驚き、全AIが合格水準の答案を提示したと評価。逆に画像や図表の認識に課題が見られた点が指摘されました。特にClaudeでは構造式や地図の読み取り精度向上が望まれます。
代表者のコメント
LifePromptの代表取締役である遠藤聡志氏は、AIが歴代最高点を記録したことに感動したと述べ、今後期待されるAIの進化についても言及しました。AIが満点を取れるタスクとそうでないものが明確に分かれる現状において、ビジネスでのAIの活用方法が今後の成功を左右するとしています。
詳細な分析や全結果
検証の詳細な結果や科目別得点分析、講師からの全分析は、以下のリンクで公開されていますので、ぜひご覧ください。
LifePromptの詳細レポートはこちら
LifePromptについて
「志を、自由にする。」をミッションに掲げる株式会社LifePromptは、AIが人々との共存を図りながら、自らも成長していく世界の実現を目指しています。2026年4月にはAI社員プラットフォーム「AxMates」を正式にローンチし、企業の意思決定にAIを効果的に取り入れる方法を提案しています。
このように、常に進化を続ける生成AI技術は、今後の教育分野やビジネスにおいて大きな影響を与えることでしょう。