贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
既然是贝叶斯分类算法,那么分类的数学描述又是什么呢?
从数学角度来说,分类问题可做如下定义:已知集合$C=y_1,y_2...y_n$和$I=x_1, x_2,x_3...x_n$,确定映射规则y = f(),使得任意$x_i \in I$有且仅有一个$y_i \in C$,使得$y_i \in f(x_i)$成立。
其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合(特征集合),其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。
分类算法的内容是要求给定特征,让我们得出类别,这也是所有分类问题的关键。那么如何由指定特征,得到我们最终的类别,也是我们下面要讲的,每一个不同的分类算法,对应着不同的核心思想。
贝叶斯公式:
$$P(B|A) = \frac{P(A|B)P(B)}{P(A)}$$
换个表达,火汁萌
$$P(类别|特征) = \frac{P(特征|类别)P(类别)}{P(特征)}$$
我们最终求的p(类别|特征)即可!就相当于完成了我们的任务。