得鹿梦鱼 得鹿梦鱼

机器学习的基本原理

机器学习

定义:在不对直接针对问题进行明确编程的情况下,赋予计算机学习能力的研究领域

通常为了更好地定义一个学习问题,我们必须要明确是哪个特征,

  • 任务的种类
  • 衡量任务提高的标准
  • 经验的来源

分类

监督学习

使用的是标注过的带有标签的数据进行训练,通常用于回归、分类等任务

无监督学习

使用的是无标签的数据进行训练,通常用于聚类、异常检测等

强化学习

算法对预测结果进行自我评估,从而不断改进

一般流程

训练阶段: 使用带有标签的训练集,在提取特征后,经过机器学习算法对数据进行学习从而习得模型
测试阶段: 对标签的未知的测试数据,通过同一种特征提取手段提取特征之后,把它们送入训练好的模型,预测数据的标签

  1. 制作数据集
  2. 选择或者设计特征提取算法
  3. 选择机器学习算法
  4. 测试

数据集

  1. 训练集
  2. 测试集
  3. 验证集

评估分类器性能的方法

  1. ROC曲线
  2. 混淆矩阵

openCV中的机器学习算法

Mahalanobis 马氏距离,表示数据的协方差
K-means 无监督的一个聚类算法
NormalBayesClassfier 朴素贝叶斯分类器
DTrees 决策树
RTrees 随机森林
SVM 支持向量机
DNN 深度学习模块
ANN 人工神经网络多层感知机算法