【第4回】3分で読める AI入門　人工知能解体新書

＂3分で読める＂シリーズの第３弾、AIに関するコラムです。　
是非ご覧ください。

≪ 本コラムの記事一覧はこちら

第4回：AIの学習の仕組み — ニューラルネットワークと深層学習

機械学習（Machine Learning）：データからの帰納的推論
ディープラーニングとニューラルネットワークの解剖
学習（Training）と推論（Inference）のコストバランス

機械学習（Machine Learning）：データからの帰納的推論

AIの学習機能の中核を成すのが「機械学習」です。
これは、明示的なプログラミングを行わずにデータからパターンやルールを学習する手法の総称です。

機械学習のアプローチには、主に3種類が存在します。

教師あり学習 (Supervised Learning）
「問題（入力）」と「正解（ラベル）」のペアデータを大量に与え、その関係性を学習させます。
例えば、メールが「スパムか否か」を判別する場合には、過去のスパムメールと通常メールのデータをラベル付きで読み込ませます。
現在のAI活用の主流となっている手法です。
教師なし学習 (Unsupervised Learning)
正解を与えず、データそのものが持つ構造や特徴をAIに見つけさせます。
顧客データの購買履歴から、似た傾向のグループ（クラスタ）を発見するマーケティング分析などに用いられます。
（例：k-means法）
強化学習 (Reinforcement Learning)
エージェント（AI）が環境内で行動し、その結果得られる「報酬」を最大化するように試行錯誤学習します。
囲碁AI「AlphaGo」や、ロボットの歩行制御などがこれに当たります。

ディープラーニングとニューラルネットワークの解剖

現代のAIブームを支える技術的基盤は、機械学習の一種である「ディープラーニング（深層学習）」です。
これは人間の脳神経回路網を模した「ニューラルネットワーク」を多層化したモデルです。

■　ニューラルネットワークの構造

ニューラルネットワークは、以下の3つの層で構成されます。

入力層 (Input Layer)
外部からのデータ（画像のピクセル値やテキストのベクトル）を受け取る窓口。
隠れ層 (Hidden Layer / 中間層)
入力されたデータから「特徴量」を抽出する層。
ここが多層（Deep）になったものがディープラーニングです。
初期の層では「線や色」などの単純な特徴を、深い層では「目や耳」「顔全体の形状」といった抽象的な概念を段階的に学習します。
出力層 (Output Layer)
最終的な判断結果（「これは猫である確率98%」など）を出力します。

■　重み（Weight）とバイアス（Bias）による学習

ネットワーク内のニューロン同士の結合には、「重み」というパラメータが設定されています。

学習とは、入力データに対して正しい出力を出せるように、この「重み」と「バイアス」を数学的に微調整するプロセス（バックプロパゲーション/誤差逆伝播法）に他なりません。
例えば、「y = Ax + B」という単純な一次関数の場合、データに合わせてA（傾き）とB（切片）を調整するのが学習です。

ディープラーニングの場合、このパラメータ（AやBに相当するもの）が数億〜数兆個存在し、それらを膨大な計算資源を用いて最適化することで、複雑な現実世界の事象をモデル化しています。

学習（Training）と推論（Inference）のコストバランス

AIの運用は「学習」と「推論」というコスト構造の異なる2つのフェーズに分かれます。

フェーズ	内容	リソースとコスト
学習 (Training)	巨大なデータセットを用いてモデルのパラメータを決定する開発工程	極めて高価。数千台のGPU（NVIDIA H100など）と数ヶ月の時間、莫大な電力が必要。
推論 (Inference)	完成した学習済みモデルに新しいデータを入力し、答えを出させる運用工程	比較的安価。学習に比べれば計算負荷は軽く、 PCやスマホのエッジデバイスでも実行可能な場合がある。即時性が求められる。