机器学习极简入门课学习笔记-第六课(机器学习三要素之数据、模型、算法)

向量空间模型(Vector Space Model,VSM)

  • 向量指一个同时具有大小和方向的几何對象。
  • 向量空间模型负责将格式(文字、图片、音频、视频)转化为一个个向量,即将真实世界里的各种对象转换为计算机可以识别的数值。

特征向量(Feature Vector)

描述一份样本数据中所有的特征所转换出来的向量叫做这份数据的特征向量

特征工程

特征工程,包括以下两个步骤:

  1. 确定用哪些特征来表示数据;
  2. 确定用什么方式表达这些特征。

模型

模型是机器学习的结果,这个学习过程,称为训练(Train)。

一个已经训练好的模型,可以被理解成一个函数: y=f(x)。

我们把数据(对应其中的 x)输入进去,得到输出结果(对应其中的 y)。

这个输出结果可能是一个数值(回归),也可能是一个标签(分类),它会告诉我们一些事情。

训练

训练就是:根据已经被指定的模型类型,结合训练数据,计算出其中各个参数的具体取值的过程。

损失函数(Loss Function)

在有监督学习过程中,经过对一份训练数据的学习后,得到一个模型y‘=f(x),再对另外一份验证数据运用这个模型计算出来得到的标签值y’与验证数据正确的标签y的差别,记做L(y, y’)= L(y, f(x))。

代价函数(Cost Function)

代价函数一般写作:J(theta)。
???

支持原创,随手一扫