机器学习的基本概念和术语

更新日期: 2018-10-01 阅读次数: 6946 分类: AI

什么是机器学习

机器学习系统是基于学习训练,然后,分析未曾见过的数据,并产生有价值的结论或预测。

Labels

Label,即我们预测的结果。Linear regression 的 Y 变量。

Label 可以是预测的小麦价格,图片中的动物,一段音频的翻译。

Features

Feature,即输入的变量。Linear regression 的 X 变量。

  • 简单的机器学习项目,可能只使用一个 Feature。
  • 而复杂的项目,可能使用成百上千个 Feature, 例如,X1, X2, … XN.

在垃圾邮件判定中,可能包含的 Feature:

  • 邮件字数
  • 发件人地址
  • 邮件的发送时间
  • 关键字

Examples

Example, 即数据实例,真实样本。

Example 分为两类:

  • Labeled examples: 同时包含 label 和 feature, (x, y)。机器学习中使用 labeled examples 去训练 model.
  • Unlabeled examples: 只包含 feature, 而没有 label。一旦我们训练好 model, 我们就会使用 model 去推测 unlabeled examples 的 label。

Models

Model 定义了 features 和 label 的关系。

Model 包含了两个过程:

  • Training,训练。即,利用 labeled examples 去建立 features 与 label 的关系。
  • inference,推断。将 trained model 应用于 unlabeled examples. 即推测出 y.

regression 与 classification 的区别

Regression 是推测连续的值。例如,随时间变化的股价。

Classification 是回答是与否的问题。例如,照片里是不是个人。

Linear regression

线性回归。这个名字太拗口了。

机器学习的基本概念和术语

线性回归的应用场景:

  • 趋势。随时间变化的值,例如石油价格,股票价格等。
  • 宏观经济数据。预测劳动力需求等。

参考:https://zh.wikipedia.org/wiki/%E7%B7%9A%E6%80%A7%E5%9B%9E%E6%AD%B8

参考

https://developers.google.cn/machine-learning/crash-course/framing/ml-terminology

关于作者 🌱

我是来自山东烟台的一名开发者,有敢兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊, 查看更多联系方式