投稿日：2024/06/28
更新日：2025/10/01

【初心者向け】生成AIとChatGPTの歴史と仕組みを徹底解説！

Nao@あなたの夢を叶えるFP

この記事は約10分で読めます

要約

ChatGPTとは何なのか、どうやって開発されたのかを、わかりやすく解説しました👍 使い方だけでなく、原理原則や歴史を知りたい方向けの記事となっています✨ 背景を知ると、もっともっと生成AIの利用が楽しくなると思いますよ❗

1. はじめに
2. そもそも生成AIとは？

2.1. 生成AIの定義

2.2. 主な生成AI

3. 生成AIの歴史

3.1. 言語処理の始まり

3.2. ニューラルネットワークの登場

3.3. 生成的敵対的ネットワーク(GAN)の発明

3.4. トランスフォーマーモデルの誕生

3.5. 一般ユーザーへの開放

4. 大規模言語モデル(LLM)とは
5. おわりに
ChatGPT関連の主な記事

1. はじめに

こんにちは❗Naoです。
大手メーカーやリベシティ内で、ChatGPTの講師をしています😊

最近ブー厶のChatGPT、使っておられる方も多いのではないでしょうか？

中には「ChatGPTとは何か」という点について興味を持たれている方もいらっしゃると思います😊

実はChatGPTは、「生成AI」と呼ばれるAIの一種なんです❗

本記事では

✅生成AIとは

✅生成AIの歴史

✅生成AIに使われている言語モデル

について、AIに詳しくない方でも分かるように解説したいと思います✨

本記事が、皆様の資産形成の参考になれば嬉しいです❗

2. そもそも生成AIとは？

2.1. 生成AIの定義

生成AIとは、今あるデータを基にして、新しいデータを生成するAIのことです✨

従来のAI：今あるデータを解析して、パターンを見つけ出す

生成AI：今あるデータを解析して、パターンを見つけ出し、そのパターンを利用して新たなデータを作り出す🫢

これまで人間特有の能力だった、創造力を持っています❗
なので、従来よりも広い領域で人間をサポートできる訳です😊

240628_生成AIの歴史と仕組み.png 生成AIの具体例としては以下のようなものがあります。

・画像生成（DALL-E 3, Stable Diffusion, Midjourneyなど）：
元々ある画像を基に、リアルな画像を生成することができます。

・文章生成（ChatGPT, Gemini, Clauda 3など）：
元々ある文章を基に、人間が書いたような文章を生成することができます。
入力したテキストを基に、自然な対話も可能です。

・音楽生成（Beatoven.ai, Soundful, Mubertなど）：
元々ある音楽を基に、作曲してくれます。BGMやクラシックを作るAIが多いようです。

2.2. 主な生成AI

文章を生成する主な生成AIを以下にまとめます。

👩「どのAIを使ったらよいか分からない」

という声をよく頂きますが、NaoはChatGPTを使っておけば、問題ないと考えています❗どの用途でも80点は取れるからです👍

ChatGPT
開発元：OpenAI
特徴：テキスト生成、画像解析が可能。質問応答、文章作成、翻訳など多様なタスクに対応可能。APIにより他のアプリケーションに組み込める。現時点で最も有名な生成AI。

Copilot
開発元：Microsoft.言語モデルはChatGPTのものを利用。
特徴：Microsoft365の様々なアプリに組み込まれている。Edgeなら検索の補佐、Officeなら文章作成の補佐、GitHub Copilotならコーディングの補佐というように、アプリの目的に応じた提案を行う。

Gemini
開発元：Google
特徴：テキスト、画像、音声、動画を統合的に理解・生成できる。Google検索やGmailなどのGoogleサービスと将来的に統合予定。ChatGPTのライバル。

Clauda
開発元：Anthoropic
特徴：テキスト生成に特化。最上位モデルのOpusは、ChatGPTより自然な日本語が生成できると評判。

Perplexity
開発元：Perplexity AI
特徴：検索に特化。ユーザーの意図を汲み取った回答が可能。情報の出典が明示される。

3. 生成AIの歴史

生成AIの歴史を簡単に振り返ってみたいと思います❗

社会的なブームになったのは2023年ですが、それより前から生成AIは存在していました🤔

3.1. 言語処理の始まり

1960年代に、MITのジョセフ・ワイゼンバウムによって"ELIZA"というプログラムが開発されました。

ELIZAは自然言葉（英語や日本語のような、人間が普通に使う言葉のこと）を使って人間と対話することを目的としていました👀

あらかじめ人間が対話のパターンをプログラムしておき、特定のキーワードが出たら、プログラムに従って答えます。

例えば以下のような感じです。

ユーザー：How are you?
ELIZA：I'm fine, thank you. And you?

ChatGPTと比べると、機械感が凄いですね❗
ELIZAの開発により、人間と機械が対話する可能性が示されました。しかし、会話パターンをプログラムするだけでは、文脈の理解ができず、応答に限界があることも分かりました😅

240628_生成AIの歴史と仕組み (1).png

3.2. ニューラルネットワークの登場

予め人間の会話パターンをプログラ厶するのに限界があるので、現代ではAIが勝手に学習する「機械学習」を使っています。

この機械学習を容易にするプログラムがニューラルネットワークです❗
名前は聞いたことがある方も多いのではないでしょうか？

ニューラルネットワークは、人間の脳の働きを模倣したプログラムで、入力したデータから複雑なパターンを自分で作り出し、学習することができます✨

1980年代にニューラルネットワークを使って効率的に学習させる手法が考案されました👍
ただし、当時はコンピュータのスペックが低かったり、学習させるデータが少なかったりしたため、実用的なプログラムはできませんでした😥

3.3. 生成的敵対的ネットワーク(GAN)の発明

その後30年が経過し、コンピュータのスペックが高まるとともデータの電子化が進み、学習させるデータの数も増えてきました。

そして2014年に実用的なプログラム"GAN"が発明されます。

「2つのニューラルネットワークを競わせて、よりリアルな画像を作成する」

というコンセプトです❗

下の図で、黄色い枠が事前に準備された訓練データ、それ以外の画像がGANで生成された画像データです。

240628_生成AIの歴史と仕組み (2).png (出典) I. J. Goodfellow et. al., 2014

ぱっと見では真贋の区別がつかないくらい、リアルな画像が生成されています。かなり生成AIっぽくなってきましたね😊

ニューラルネットワークの実用性が証明され、AIの画像生成、動画生成、音楽生成など、様々な分野が一気に進展しました✨
しかし、まだ自然言語で人間と対話できるAIは生まれていませんでした👀

3.4. トランスフォーマーモデルの誕生

なぜ画像生成はできるのに、人間と対話できるAIは生まれていなかったのでしょうか？

それは、文脈の理解が難しいからです💦
5分前の発言を踏まえて会話する、ということは人にとっては普通ですが、AIにとっては難しいのです。

しかし2018年、「トランスフォーマーモデル」と呼ばれる新しい技術が誕生しました。
トランスフォーマーモデルはニューラルネットワークの一種で、文章の中の単語どうしの関係性を、同時に考慮することができるモデルです❗
開発元はGoogleです👀

全ての単語の関係性を考慮できるので、遠く離れた単語どうしの関係を理解したり、文章の前後関係を把握したりすることが可能です😊

Googleはこの技術を用いて、検索エンジンの精度向上や、チャットボットの改善などを行いました✨

そしてこのトランスフォーマーモデルを使って開発されたのが、OpenAIのGPT(Generative Pre-trained Transformer)シリーズです。GPTのTはトランスフォーマーのTなんですね〜😯

GPTは膨大な量の文章を学習しています。ですから、ユーザーの質問の文脈を理解して、新しい文章を作ってくれるわけです❗

2020年にはGPT-3が発表され、人間と見分けがつかないほど自然な文章を生成できるので注目されました。

3.5. 一般ユーザーへの開放

GPT-3が2020年に開発されましたが、開発当初はアクセスが制限されていました。また、APIとしてのサービス提供であったため、一般ユーザーが使える状態ではありませんでした💦

トランスフォーマーモデルは、人間がルールを与えている訳ではなく、大量のデータを与えて自分で学習させたものです。なので不正確な情報を生成しますし、倫理観も備わっていません。一般ユーザーに開放すると、犯罪や差別の助長、誤った使い方をされてしまう可能性が飛躍的に高まります😱

2年間かけてモデルの改良・調整を行って、2022年11月30日に対話型のアプリ「ChatGPT」が一般ユーザーに遂にリリースされました❗

一般ユーザーでも自然言語で対話が出来るということで、大いに話題になりました。
その後の社会的インパクトはご存知のとおりです😊

4. 大規模言語モデル(LLM)とは

生成AIのことを勉強すると、大規模言語モデル（LLM）という言葉を目にするはずです👀

大規模言語モデルは、大量のテキストデータで学習したトランスフォーマーモデルのことです❗

トランスフォーマーモデルについては、3.4.をご確認下さい👍

有名な大規模言語モデルとしては、GoogleのGeminiやOpenAIのGPTが有名です✨

大量のテキストデータを読み込んでいるので文脈を理解でき、人間のような文章を作成することが可能です。

「大量のテキストデータを読み込む」と簡単に言いましたが、これがとーーっても難しいのです❗❗

まず、数十億単語から数百億単語を含むデータを準備します。これを、「教師用データ」といいます。インターネットのウェブサイトや論文、書籍などから調達します💦

このとき、データに不正確な情報が含まれていたらうまく学習できません😱
信頼性が高いデータを選んで集めなければなりません。

次に、トランスフォーマーモデルに集めたデータを学習させます。学習は、「次に来る単語を予測する」というプロセスの繰り返しです。

例えば「スーパーに行ってりんごを…」という文章があったら、次に来るのは「買った」の確率が高いですよね😊

このような単語の予測問題を、与えたデータで大量に実施することで、文脈に基づいた、適切な単語を使えるようになります❗

学習してもそれで終わりではありません。

訓練したモデルのチェックも必要です。差別的な表現が無いか、嘘を言わないか、特定の考えに偏っていないか…

モデルをチェックし、適切な答えが返ってくるよう調整する必要があります💦

しかし、トランスフォーマーモデルの中身は凄く複雑ですから、適切な答えが返ってこなくても原因が分からないことが多いのです。
なので、手探りで調整していきます😅

このような学習プロセスに、OpenAIは数千億円をかけていると言われています。資金が潤沢にある企業でないと、開発は難しそうですね👀

5. おわりに

以上、簡単に生成AIとChatGPTの歴史と仕組みを見てみました。

様々な技術の積み重ねで、私達はChatGPTを使えているのですね🤔

現代に生まれて良かったです✨

背景を知ると、もっともっと生成AIの利用が楽しくなると思います❗

本記事に、皆様の参考になる部分があったら嬉しいです😊

他にも、以下の記事を投稿しています。宜しければご覧ください✨

ChatGPT関連の主な記事

ChatGPTの利用例

①【大公開❗】楽しく学ぶChatGPT初心者セミナー【リベシティを題材に】

②【初心者〜中級者向け】ChatGPTを本業/副業で活用する方法【セミナー資料】

ChatGPTの設定

【PC】超簡単！GoogleアカウントでChatGPTの初期設定をしよう❗【Mac対応】

【スマホ】簡単設定！スマホで使うChatGPT4o完全ガイド【メルカリ出品も解説！】

便利な拡張機能など

①【ChatGPT】間違えてEnterを押してしまう方へ【拡張機能で解決！】

②もう悩まない❗プロンプト入力の手間を激減する神機能を紹介【ChatGPT】

③【期間限定？】GMOの出血大サービス！有料AIを無料で使い倒せるチャンス

その他の記事はこちらでジャンル別にご確認頂けます✨

	新入生会員（無料）	応援会員（有料）
各種チャット機能
公式オフィスの利用
オンラインスペース（ovice）の利用
ノウハウ図書館などの会員向けサービス	一部機能制限あり	一部条件あり

【初心者向け】生成AIとChatGPTの歴史と仕組みを徹底解説！

1. はじめに