1 人工智能、机器学习、深度学习的关系
“人工智能” 一词最早是再20世纪50年代提出来的。
“ 机器学习 ” 是通过算法,使用大量数据进行训练,训练完成后会产生模型
- 有监督的学习 supervised learning
- 无监督的学习 unsupervised learning
- 增强式学习 reinforcement learning
已经应用领域:推荐引擎、定向广告、需求预测、垃圾邮件过滤、医学诊断、自然语言处理、搜索引擎、证券分析、视觉识别、语音识别、手写识别等
“ 深度学习 ” 是机器学习的分支,其仿真人类神经网络的工作方式,常见深度学习架构有
- 多层感知器 multi-layer perceptron
- 深度神经网络 deep neural network ,DNN
- 卷积神经网络 convolutional neural network , CNN
- 递归神经网路 recurrent neural network , RNN
已经应用领域:视觉识别,语音识别,自然语言处理,生物医学等
另:
GPU(Graphics Processing Unit)为图形处理器,用于电脑的图形运算,
CPU与GPU的架构有本质的不同,CPU 含有数颗核心,为顺序处理进行优化;而GPU 则拥有高达数千个小型且高效的核心,发挥强大并行计算能力。
深度学习以大量矩形运算模拟神经元的工作方式,该工作方式特别适合并行计算。GPU通过大量核心并行计算,在深度学习训练中,GPU比CPU要快10~75倍。
Google 公司于2016年宣布人工智能专用芯片 TPU(Tensor Processing Unit,张量处理单元 / 张量处理芯片)来进行计算;TPU 是专为深度学习设计的特殊规格的逻辑芯片(IC),使得深度学习的训练速度更快。
2 机器学习介绍
机器学习的训练数据构成:
- 数据特征features
- 数据标签label
机器学习分为两个阶段:
- 训练Training
- 预测Predict
3 机器学习分类
3.1 有监督的学习
有监督的学习的数据具备特征features、预测目标/标签label两要素。通过算法训练并建立模型。当有新的数据时,我们将其进行预测。
- 二元分类,特征features的标签label有两个(离散)选项。
- 多元分类,特征features的标签label有至少两个(离散)选项
- 回归分析,特征features的标签label是连续的值。
3.2 无监督的学习
该方式无label标签。
如 cluster 集群算法将数据分成几个差异较大的群组,而群组内的相似度最高。
3.3 增强式学习
增强式学习原理:借助定义动作actions、状态states、奖励rewards的方式不断训练机器循序渐进,使其学会执行某项任务的算法。
常见算法有:Q-Learning、TD(Temporal Difference)、Sarsa 等。
如训练机器玩《超级玛丽》电子游戏就是借助不断训练学会玩游戏,对应状态有:
- 动作:左、右、跳
- 状态:当前游戏界面
- 奖励:得分、受伤
4 深度学习简介
一个输入层、一个输出层、N个隐藏层,所以称之为深度学习。