以往,人们不太正式地这样定义机器学习:
不通过明确地编程,而使得计算机拥有学习的能力的这样一个学习领域。
Tom Mitchell 提供了这样一个新的定义
- E(experience): 经验(在算法中相当于训练数据)
- T(task): 任务、目标(比如通过算法希望识别类型)
- P(probability): 预测的正确概率
一个计算机程序从经验E中学习,并希望达到一个目标T,然后用P来衡量算法的性能(T的准确率),而对于经验E的学习将提升P
举个下棋的例子
- E代表玩很多很多盘棋的经验
- T代表下棋
- P代表程序将赢得下一盘棋的概率
一般来说,任何机器学习的问题,都可以被分为两个大类
- 监督学习
- 无监督学习