机器学习的基本概念和术语

文章目录

    什么是机器学习

    机器学习系统是基于学习训练,然后,分析未曾见过的数据,并产生有价值的结论或预测。

    Labels

    Label,即我们预测的结果。Linear regression 的 Y 变量。

    Label 可以是预测的小麦价格,图片中的动物,一段音频的翻译。

    Features

    Feature,即输入的变量。Linear regression 的 X 变量。

    • 简单的机器学习项目,可能只使用一个 Feature。
    • 而复杂的项目,可能使用成百上千个 Feature, 例如,X1, X2, … XN.

    在垃圾邮件判定中,可能包含的 Feature:

    • 邮件字数
    • 发件人地址
    • 邮件的发送时间
    • 关键字

    Examples

    Example, 即数据实例,真实样本。

    Example 分为两类:

    • Labeled examples: 同时包含 label 和 feature, (x, y)。机器学习中使用 labeled examples 去训练 model.
    • Unlabeled examples: 只包含 feature, 而没有 label。一旦我们训练好 model, 我们就会使用 model 去推测 unlabeled examples 的 label。

    Models

    Model 定义了 features 和 label 的关系。

    Model 包含了两个过程:

    • Training,训练。即,利用 labeled examples 去建立 features 与 label 的关系。
    • inference,推断。将 trained model 应用于 unlabeled examples. 即推测出 y.

    regression 与 classification 的区别

    Regression 是推测连续的值。例如,随时间变化的股价。

    Classification 是回答是与否的问题。例如,照片里是不是个人。

    Linear regression

    线性回归。这个名字太拗口了。

    机器学习的基本概念和术语

    线性回归的应用场景:

    • 趋势。随时间变化的值,例如石油价格,股票价格等。
    • 宏观经济数据。预测劳动力需求等。

    参考:https://zh.wikipedia.org/wiki/%E7%B7%9A%E6%80%A7%E5%9B%9E%E6%AD%B8

    参考

    https://developers.google.cn/machine-learning/crash-course/framing/ml-terminology

    关于作者 🌱

    我是来自山东烟台的一名开发者,有感兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊,或者关注我的个人公众号“大象工具”, 查看更多联系方式