廊坊新闻网-主流媒体,廊坊城市门户

【读书笔记】算法漫步 第18章

2023-07-30 23:17:45 来源:哔哩哔哩


【资料图】

问题15 分类

这章介绍的事人工智能中的一个基本环节—分类。数据研究的基础正是给数据“贴标签”进行分类。类别分得越精准,得到的结果就越有价值。

分类是一个有监督的学习过程,目标数据库中有哪些类别是已知的,分类过程需要做的就是把每一条记录归到对应的类别之中。由于必须事先知道各个类别的信息,并且所有待分类的数据条目都默认有对应的类别。

设计分类算法的目的就是实现一个“分类器”。分类器的实现通常都是基于一批已知类别的数据,形成某些规则,来做未知类别对象的类别判断。

如果用计算机来分类,每一种类别则都需要通过一些数据特征予以刻画,每一个对象或者个体都是通过一个“数据点”来表示。

分类问题中,一个核心的概念事两个数据点之间的距离。所谓判断一个数据点该属于哪个类,本质上就是看它离哪个类的已知数据点更近。

本章介绍了

k近邻(KNN)算法和支持向量机(SVM)算法

【作者感受】

计算机来做分类,刻画数据特征的维度和标准,定义距离,都是很有挑战的事情,决定了分类算法的实现难度,和分类结果有意义(准确度)的程度。

关键词: