
"3分で読める"シリーズの第3弾、AIに関するコラムです。
是非ご覧ください。
≪ 本コラムの記事一覧はこちら
第4回:AIの学習の仕組み — ニューラルネットワークと深層学習
機械学習(Machine Learning):データからの帰納的推論
AIの学習機能の中核を成すのが「機械学習」です。
これは、明示的なプログラミングを行わずにデータからパターンやルールを学習する手法の総称です。
機械学習のアプローチには、主に3種類が存在します。
- 教師あり学習 (Supervised Learning)
「問題(入力)」と「正解(ラベル)」のペアデータを大量に与え、その関係性を学習させます。
例えば、メールが「スパムか否か」を判別する場合には、過去のスパムメールと通常メールのデータをラベル付きで読み込ませます。
現在のAI活用の主流となっている手法です。 - 教師なし学習 (Unsupervised Learning)
正解を与えず、データそのものが持つ構造や特徴をAIに見つけさせます。
顧客データの購買履歴から、似た傾向のグループ(クラスタ)を発見するマーケティング分析などに用いられます。
(例:k-means法) - 強化学習 (Reinforcement Learning)
エージェント(AI)が環境内で行動し、その結果得られる「報酬」を最大化するように試行錯誤学習します。
囲碁AI「AlphaGo」や、ロボットの歩行制御などがこれに当たります。
ディープラーニングとニューラルネットワークの解剖
現代のAIブームを支える技術的基盤は、機械学習の一種である「ディープラーニング(深層学習)」です。
これは人間の脳神経回路網を模した「ニューラルネットワーク」を多層化したモデルです。
■ ニューラルネットワークの構造
ニューラルネットワークは、以下の3つの層で構成されます。

- 入力層 (Input Layer)
外部からのデータ(画像のピクセル値やテキストのベクトル)を受け取る窓口。 - 隠れ層 (Hidden Layer / 中間層)
入力されたデータから「特徴量」を抽出する層。
ここが多層(Deep)になったものがディープラーニングです。
初期の層では「線や色」などの単純な特徴を、深い層では「目や耳」「顔全体の形状」といった抽象的な概念を段階的に学習します。 - 出力層 (Output Layer)
最終的な判断結果(「これは猫である確率98%」など)を出力します。
■ 重み(Weight)とバイアス(Bias)による学習
ネットワーク内のニューロン同士の結合には、「重み」というパラメータが設定されています。
学習とは、入力データに対して正しい出力を出せるように、この「重み」と「バイアス」を数学的に微調整するプロセス(バックプロパゲーション/誤差逆伝播法)に他なりません。
例えば、「y = Ax + B」という単純な一次関数の場合、データに合わせてA(傾き)とB(切片)を調整するのが学習です。
ディープラーニングの場合、このパラメータ(AやBに相当するもの)が数億〜数兆個存在し、それらを膨大な計算資源を用いて最適化することで、複雑な現実世界の事象をモデル化しています。
学習(Training)と推論(Inference)のコストバランス
AIの運用は「学習」と「推論」というコスト構造の異なる2つのフェーズに分かれます。
| フェーズ | 内容 | リソースとコスト |
| 学習 (Training) | 巨大なデータセットを用いて モデルのパラメータを決定する 開発工程 | 極めて高価。 数千台のGPU(NVIDIA H100など)と数ヶ月の時間、莫大な電力が必要。 |
| 推論 (Inference) | 完成した学習済みモデルに 新しいデータを入力し、 答えを出させる運用工程 | 比較的安価。 学習に比べれば計算負荷は軽く、 PCやスマホのエッジデバイスでも 実行可能な場合がある。 即時性が求められる。 |
お読みいただきありがとうございました。
次回のコラムは2月12日(木)更新予定です。