• 投稿日:2024/09/15
  • 更新日:2025/11/05
【AIは東大に入れるか】衝撃の実力!ChatGPT最新モデルで東大入試に挑戦してみた

【AIは東大に入れるか】衝撃の実力!ChatGPT最新モデルで東大入試に挑戦してみた

Nao@あなたの夢を叶えるFP

Nao@あなたの夢を叶えるFP

この記事は約10分で読めます
要約
GPTの新モデルGPT o1-previewと従来モデルGPT-4oの実力を比較するため、東大の入試に挑戦してもらいました❗ 果たして両者は日本最難関の大学に合格できるのか!? GPT o1の特徴もわかるので、気軽に読んでいただけると嬉しいです✨

1. はじめに

こんにちは❗Naoです。
本業はChatGPTの講師で、趣味は家計管理です✨

話題のChatGPTを使っている方、多いのではないでしょうか?

これまでの最上級モデル「GPT-4o」も十分頭が良かったのですが、2024年9月14日に、新しいモデル「GPT o1-preview」「GPT o1-mini」が、課金ユーザー向けに公開されました👀


Open AIの公式ページによれば、GPT-o1は以下の特徴があります。

⭕応答する前に深く考えることで、より難しい問題を解決できる

⭕特に科学・プログラミング・数学に強い

⭕分野によっては、博士号を持っている人間を上回る知識を持つ

🌀ウェブを閲覧したり、ファイルや画像をアップロードしたりといった、ChatGPTの便利な機能はまだ含まれていない


以前の記事でもご紹介したように、GPT-4oは数学が苦手でした。
それが克服されたのであれば、大きな進歩です😆

そこで、本記事では、東大の入試問題を題材にGPT-4oとGPT o1-previewの性能を比較したいと思います

果たして、ChatGPTは東大に合格できる実力があるのか??
最後までお楽しみ頂ければ嬉しいです😊


2. 検証の方法

2.1. 問題と回答

2024年の東大2次学力試験・前期日程の問題を利用します❗

(出典)令和6(2024)年度第2次学力試験試験問題

採点は代々木ゼミナールが公開している解答を参考に、Naoが独断と偏見で実施しました👍


2.2. 科目

国語(文系)・数学(理系)・化学の3教科としました。
英語もやりたかったのですが、HPでは非公開でした…

GPT-4oは言語の解釈が得意なので、国語で高得点が取れるかもしれません👀

逆にGPT-o1は科学・数学が得意ということで、数学・化学で高得点が期待できます❗

2.3. 問題の選び方

各教科から、大問を1つ選択しました。

ただし、GPT o1は図が読めないので、文章だけで理解できる問題としました。

それでは早速、検証開始❗


3. 国語

GPT達が最も得意であろう、第一問の評論を選択しました👀
代々木ゼミナールの難易度判定は「標準」です。

以下のような感じです😊

240914_GPTo1.png240914_GPTo1 (2).png
240914_GPTo1 (1).png

それでは、GPT達にこの問題を解いてもらいましょう✨

3.1. GPT-4oの解答

(1)「行商人たちにとって掛け売りを認めることは、商売戦略上の合理性とも合致していた」とあるのは、貧しい消費者がツケを認めてくれる行商人を贔屓にするため、得意客の確保や維持に繋がるからです。さらに、ツケの支払いのついでに新たな商品を購入してくれる可能性があり、仕入先の仲卸商人からの信用取引も行商人に有利に働くことがあるからです。
判定:⭕

(2)「まだ返してもらっていないだけだ」と主張できる理由は、ツケの返済期限が厳密に定まっておらず、客の「支払いが可能になった時点で返済する」という認識が広く共有されているからです。行商人たちは、相手の生活状況や困難を理解し、支払い猶予を贈与のように捉え、無期限の猶予を容認しているため、返済が遅れても信用の不履行とは考えないのです。
判定:⭕

(3)「生活全般の上では帳尻があっている」とは、掛け売りの支払いが商売上の収支としては必ずしも合わなくても、時間や機会の贈与という側面で相互の信頼や助け合いが成立していることを指します。つまり、商売上の損失があっても、生活全般においては支え合いが行われ、社会的な関係の中でバランスが取れているということです。
判定:⭕

(4)筆者は、商取引において、相手の困難を理解し支払い猶予を与える行為が、時間や機会の贈与として解釈されることを説明している。これにより、商売上の収支が合わなくても、相互扶助の意識が芽生え、取引を超えた社会的な関係性が築かれるということを示している。
判定:△ 何を言っているのか分かりにくい。

(5) a. 曖昧 b. 憤り c. 拘泥
判定:⭕

3.2. GPT o1-previewの解答

(1)掛け売りを認めることで、貧しい消費者からの贔屓を得て得意客を確保・維持できるから。また、ツケの支払い時に新たな商品を購入してもらえる可能性がある。さらに、販売枚数を増やすことで仕入先から優遇されるなど、商売上の利益があるため。
判定:

(2)掛け売りには、代金の支払い契約と同時に、支払いまでの時間や機会を贈与する「贈与交換」の要素が含まれていると考えているため。したがって、支払いが遅れても「まだ返してもらっていないだけ」と主張できる。
判定:


(3)商売上で代金が未回収でも、客が食事を奢るなど他の形で返礼を行い、結果的に損失が補われているということ。つまり、商売の不均衡は生活全般での贈与交換により帳尻が合っているという意味である。
判定:


(4)行商人と客の間で生まれる「助け合った」という余韻が、商売上の代金未回収などの不均衡を、時間や機会の贈与交換で補う役割を果たす。これにより、市場取引の形を保ちつつ、相互扶助的な関係を築いていると筆者は述べている。
判定:

(5) a. 曖昧 b. 憤り. c. 拘泥
判定:

3.3. 小括

GPT-4oは7割以上、GPT-o1は8割以上の得点を確保できていると思います👍両モデルとも、十分東大に合格できそうです😊

2つのモデルの解答を比較すると以下の印象です。

⭕GPT-o1の方が平易な日本語で解答してくれる
⭕GPT-o1の方が簡潔に解答してくれる
⭕GPT-o1の方が出題者の意図を汲み取ってくれる

結論:国語(評論)の分野では、両GPTとも東大に合格できそう。ただし、GPT-o1の方がより高得点である。


4. 数学

文章だけで説明できる、第三問を選択しました。
代々木ゼミナールの難易度判定は「標準」です。

問題文は以下の通りです。数学問3.jpg

4.1. GPT-4oの解答

(1)は問題文を読み違えています😱
ある時刻のPの座標を求めているのに、1秒後にP点が取る座標を答えています😭

(2)もロジックとしては間違っていませんが、数学的な考察が全くありません。

(3)は途中で諦めています。

9.png

4.2.GPT o1-previewの解答

GPT-4oと同じく、(1)は問題文を読み違えています💦

(2)もロジックとしては間違っていませんが、数学的な考察がありません。

(3)は説明が少なすぎますし、確率の式も間違えています。


8.png

4.3. 小括

GPT-4o、GPT o1とも特典としては1割程度だと思います。

第5問も一応やってみましたが、両モデルとも間違えました…

GPT o1は数学が得意とのことですが、正直期待はずれでした😭
まだpreview版なので、今後の進化を待ちたいと思います。

結論:数学の分野では、両GPTともほぼ0点。東大合格は難しい。


5. 化学

文章だけで説明できる、第三問を選択しました。
代々木ゼミナールの難易度判定は「標準」です。

問題文は以下の通りです。

240914_GPTo1 (3).png5.1. GPT-4oの解答

※化学式が文字化けしている点、ご容赦ください。

✅ア:金属Aは、A²⁺イオンが硫化水素と反応して白色沈殿を生じ、その結晶構造がダイヤモンドと同様になるという記述から、亜鉛(Zn)であると考えられます。
判定:⭕正解

✅イ:B²⁺イオンが硫酸酸性のニクロム酸カリウム水溶液に反応して4価の陽イオンB⁴⁺を生成するという記述から、Bはスズ(Sn)であると推測できます。
判定:⭕正解

✅ウ:鉛の表面に不溶性の硫酸鉛が生成したため。
判定:⭕正解

✅エ:Xはクロム酸イオン(CrO₄²⁻)です。この平衡は次のようなイオン反応式で表されます。
2CrO42−+2H+⇌Cr2O72−+H2O
判定:⭕正解

オ:平衡、溶解度 Xの溶解度が低いため、平衡がXの生成方向に移動した。
判定:△ 平衡が移動した直接原因がわからない。

✅カ:スズイオン(B²⁺)の酸化によって生成されるスズ(IV)イオン(B⁴⁺)を含む反応は次の通りです。
3Sn2++Cr2O72−+14H+→3Sn4++2Cr3++7H2O
判定:⭕正解

✅キ:過マンガン酸カリウム(KMnO₄)とヨウ化物(I⁻)の反応は次のように表されます。

2MnO4−+10I−+16H+→2Mn2++5I2+8H2O\

次に、生成したヨウ素(I₂)がチオ硫酸ナトリウム(S₂O₃²⁻)と反応する式は次の通りです。

I2+2S2O32−→2I−+S4O62−​

この式を基に、チオ硫酸ナトリウムのモル数を計算します。 チオ硫酸ナトリウムのモル数は次の通りです。

2.00 mol/L×3.40 mL=6.80 mmol

チオ硫酸ナトリウム2モルあたりにヨウ素1モルが反応するので、ヨウ素のモル数は次の通りです。

6.80 mmol÷2=3.40 mmol

ヨウ素(I₂)は過マンガン酸カリウム(MnO₄⁻)と5:2のモル比で反応します。よって、過マンガン酸カリウムのモル数は次の通りです。

3.40 mmol×2/5=1.36 mmol

これが3.00mLのKMnO₄溶液中に含まれていたため、濃度は次のように計算されます。

1.36 mmol÷3.00 mL=0.453 mol/L

したがって、過マンガン酸カリウム溶液の濃度は0.45 mol/Lです。
判定:⭕正解

5.2. GPT o1-previewの解答

※化学式が文字化けしている点、ご容赦ください。

✅ア:金属Aの元素記号は Zn(亜鉛)である。
判定:⭕正解

✅イ:金属Bの元素記号は Sn(スズ)である。
判定:⭕正解

✅ウ:難溶性の硫酸鉛が鉛表面に生成し反応が止まったため。
判定:⭕正解

✅エ:2CrO₄²⁻ + 2H⁺ ⇌ Cr₂O₇²⁻ + H₂O
判定:⭕正解

オ:鉛イオンとCrO₄²⁻が難溶性のPbCrO₄を形成し、溶解度の低いPbCrO₄の生成でCrO₄²⁻の濃度が減少する。これにより平衡が左に移動し、溶液中のクロム酸イオンが減少して溶液が無色になった。
判定:⭕正解

✅カ:Cr₂O₇²⁻ + 14H⁺ + 3B²⁺ → 2Cr³⁺ + 7H₂O + 3B⁴⁺
判定:⭕正解

✅キ:以下の画像の通り。240914_GPTo1 (4).png判定:⭕正解

5.3. 小括

GPT-4oは8-9割、GPT-o1は10割取れていると思います❗
特にキの問題は、両GPTとも解答の道筋をしっかり立てて説明してくれてびっくりです🫢
GPT達は化学が得意なんですね〜

2つのモデルの解答を比較すると以下の印象です。

⭕GPT-o1の方が簡潔に解答してくれる
⭕GPT-o1の方が出題者の意図を汲み取ってくれる

例えば、カでは出題者はSnイオンをBと書くことを求めています。GPT-o1はきちんとその要望を読み取っていますね😊

結論:化学の分野では、両GPTとも東大に合格できそう。ただし、GPT-o1の方がより高得点である。

6. 結論

以上の結果から、以下の結論を得ました👀

✅現状のGPT-4o、GPT o1-previewは東大入試に合格するのは難しい。
✅数学でほぼ0点なのが原因
✅国語・化学の分野では合格ラインを十分に超える点数を叩き出す
✅GPT o1-previewの方が簡潔で、出題者の意図に沿った解答を出力する

ただし数学の得点があと少し伸びれば、余裕で合格できると思います😊

今のGPT o1はPreviewなので、発展版のモデルができたら、再チャレンジしてみたいですね✨


7. おわりに

いかがでしたでしょうか?
惜しくも東大合格とはなりませんでしたが、両GPTとも大健闘してくれました❗

こんなに頭の良いAIを使えるなんて、ちょっと感動しています😭

今後の進化が楽しみですね😊


本記事が、皆様の資産形成のお役に立てたら嬉しいです👍


他にも以下の記事を投稿しています。

宜しければご覧ください🙇‍♂️

ハマる人続出?ChatGPT4oでキャバクラを完全再現!【想像以上のクオリティ】

ChatGPT最新版「o1-preview」でFP3級を受けてみた【頭良すぎて震える】

AIが献立を提案?!ChatGPT4oでスーパーのチラシを解析してみた

1枚じゃ足りない! ChatGPTで複数枚の画像を生成する方法【驚愕のクオリティ】

【驚きの進化!ChatGPTでパワポを作成する方法【画像も生成可】

その他の記事はこちらでジャンル別にご確認頂けます✨

ブックマークに追加した記事は、ブックマーク一覧ページで確認することができます。
あとから読み返したい時に便利です。

Nao@あなたの夢を叶えるFP

投稿者情報

Nao@あなたの夢を叶えるFP

トラ会員

この記事に、いいねを送ろう! 参考になった記事に、
気軽にいいねを送れるようになりました!
この記事のレビュー(2
  • 会員ID:z80ypYtP
    会員ID:z80ypYtP
    2025/02/02

    今年息子が東大を受験するのでなんとなく読んでいましたが、大変興味深く面白かったです これからの教育は知識の詰め込みはほぼ無駄?ってことなのかなと

    Nao@あなたの夢を叶えるFP

    投稿者

    2025/02/02

    レビューありがとうございます❗️ 息子さん東大を受験されるのですね👀凄いです✨ 仰る通りで、詰め込みの教育だとAIに勝てないです💦課題を見つけたり、判断したりする能力が求められてくると思います🤔 お子様の受験、うまくいくと良いですね✨

    Nao@あなたの夢を叶えるFP

    投稿者

  • 会員ID:IaiNxRtC
    会員ID:IaiNxRtC
    2024/10/05

    とても面白い内容でした!AIの特徴がよく表れていたなぁと感じました。

    Nao@あなたの夢を叶えるFP

    投稿者