多层感知机(MLP)
多层感知机(Multilayer Perceptron,MLP)是最基础、最经典的前馈人工神经网络,也叫深度前馈网络,是深度学习的“入门骨架”。
一、MLP 是什么
- 属于前馈神经网络(信号只从输入→输出单向走,无回头/循环)
- 是全连接神经网络(FCN) 的典型代表
- 是深度学习最简单的形式(至少 1 层隐藏层就叫“深度”)
- 可以看作逻辑回归的堆叠升级版
二、MLP 的核心结构
标准 MLP 由三层结构组成:
- 输入层(Input Layer)
- 隐藏层(Hidden Layer)
- 输出层(Output Layer)
1. 输入层
作用:接收原始数据
单元数 = 数据特征维度
例:输入一张 28×28 展平的手写数字图 → 784 个输入神经元
2. 隐藏层
- 作用:提取特征、学习非线性关系
- 可以有 1 层或多层(层数越多,模型越强也越难训练)
- 层内每个神经元与上一层所有神经元全连接
- 每一层都要加激活函数(否则多层等价于单层)
3. 输出层
- 作用:输出最终预测结果
- 神经元数量由任务决定:
- 二分类:1 个神经元
- 10 分类:10 个神经元
- 回归任务:1 个神经元