【第4回】3分で読める AI入門 人工知能解体新書

"3分で読める"シリーズの第3弾、AIに関するコラムです。 
是非ご覧ください。

本コラムの記事一覧はこちら


第4回:AIの学習の仕組み — ニューラルネットワークと深層学習
機械学習(Machine Learning):データからの帰納的推論

AIの学習機能の中核を成すのが「機械学習」です。
これは、明示的なプログラミングを行わずにデータからパターンやルールを学習する手法の総称です。

機械学習のアプローチには、主に3種類が存在します。

  • 教師あり学習 (Supervised Learning
    「問題(入力)」と「正解(ラベル)」のペアデータを大量に与え、その関係性を学習させます。
    例えば、メールが「スパムか否か」を判別する場合には、過去のスパムメールと通常メールのデータをラベル付きで読み込ませます。
    現在のAI活用の主流となっている手法です。

  • 教師なし学習 (Unsupervised Learning)
    正解を与えず、データそのものが持つ構造や特徴をAIに見つけさせます。
    顧客データの購買履歴から、似た傾向のグループ(クラスタ)を発見するマーケティング分析などに用いられます。
    (例:k-means法)

  • 強化学習 (Reinforcement Learning)
    エージェント(AI)が環境内で行動し、その結果得られる「報酬」を最大化するように試行錯誤学習します。
    囲碁AI「AlphaGo」や、ロボットの歩行制御などがこれに当たります。
ディープラーニングとニューラルネットワークの解剖

現代のAIブームを支える技術的基盤は、機械学習の一種である「ディープラーニング(深層学習)」です。
これは人間の脳神経回路網を模した「ニューラルネットワーク」を多層化したモデルです。

■ ニューラルネットワークの構造

ニューラルネットワークは、以下の3つの層で構成されます。

  • 入力層 (Input Layer)
    外部からのデータ(画像のピクセル値やテキストのベクトル)を受け取る窓口。

  • 隠れ層 (Hidden Layer / 中間層)
    入力されたデータから「特徴量」を抽出する層。
    ここが多層(Deep)になったものがディープラーニングです。
    初期の層では「線や色」などの単純な特徴を、深い層では「目や耳」「顔全体の形状」といった抽象的な概念を段階的に学習します。

  • 出力層 (Output Layer)
    最終的な判断結果(「これは猫である確率98%」など)を出力します。
■ 重み(Weight)とバイアス(Bias)による学習

ネットワーク内のニューロン同士の結合には、「重み」というパラメータが設定されています。

学習とは、入力データに対して正しい出力を出せるように、この「重み」と「バイアス」を数学的に微調整するプロセス(バックプロパゲーション/誤差逆伝播法)に他なりません。
例えば、「y = Ax + B」という単純な一次関数の場合、データに合わせてA(傾き)とB(切片)を調整するのが学習です。

ディープラーニングの場合、このパラメータ(AやBに相当するもの)が数億〜数兆個存在し、それらを膨大な計算資源を用いて最適化することで、複雑な現実世界の事象をモデル化しています。

学習(Training)と推論(Inference)のコストバランス

AIの運用は「学習」と「推論」というコスト構造の異なる2つのフェーズに分かれます。

フェーズ内容リソースとコスト
学習
(Training)
巨大なデータセットを用いて
モデルのパラメータを決定する
開発工程
極めて高価
数千台のGPU(NVIDIA H100など)と数ヶ月の時間、莫大な電力が必要。
推論
(Inference)
完成した学習済みモデルに
新しいデータを入力し、
答えを出させる運用工程
比較的安価
学習に比べれば計算負荷は軽く、
PCやスマホのエッジデバイスでも
実行可能な場合がある。
即時性が求められる。

お読みいただきありがとうございました。
次回のコラムは2月12日(木)更新予定です。