机器学习的基本原理
机器学习
定义:在不对直接针对问题进行明确编程的情况下,赋予计算机学习能力的研究领域
通常为了更好地定义一个学习问题,我们必须要明确是哪个特征,
- 任务的种类
- 衡量任务提高的标准
- 经验的来源
分类
监督学习
使用的是标注过的带有标签的数据进行训练,通常用于回归、分类等任务
无监督学习
使用的是无标签的数据进行训练,通常用于聚类、异常检测等
强化学习
算法对预测结果进行自我评估,从而不断改进
一般流程
训练阶段: 使用带有标签的训练集,在提取特征后,经过机器学习算法对数据进行学习从而习得模型
测试阶段: 对标签的未知的测试数据,通过同一种特征提取手段提取特征之后,把它们送入训练好的模型,预测数据的标签
- 制作数据集
- 选择或者设计特征提取算法
- 选择机器学习算法
- 测试
数据集
- 训练集
- 测试集
- 验证集
评估分类器性能的方法
- ROC曲线
- 混淆矩阵
openCV中的机器学习算法
Mahalanobis 马氏距离,表示数据的协方差
K-means 无监督的一个聚类算法
NormalBayesClassfier 朴素贝叶斯分类器
DTrees 决策树
RTrees 随机森林
SVM 支持向量机
DNN 深度学习模块
ANN 人工神经网络多层感知机算法