原理
假设每组数据是从分布中独立抽取的(分布未知)
对任一分类器,它的预测误差可表示为(注:)
对任一固定的值,,其中为分类个数
使得最小的分类器为。对所有的取值均满足这一性质的分类器即为贝叶斯分类器,它在所有分类器中使得预测误差最小
由贝叶斯法则可以推导出贝叶斯分类器
朴素贝叶斯
朴素贝叶斯假设数据的特征是条件相互独立的,即,其中为特征个数
以垃圾邮件的分类问题为例,每个特征代表对应的单词在邮件中的出现次数,表示正常邮件,表示垃圾邮件
假设,并定义,则问题变为对参数和的求解
使用最大似然估计对参数进行求解,即
令,并令上式的一阶导数为0,可以得到参数的估计值为,
综上所述求得的朴素贝叶斯分类器为
LDA和QDA
线性判别分析LDA和二次判别分析QDA都假设每个类内的特征符合多维高斯分布,即
LDA与QDA的区别是LDA假设每个类内的协方差矩阵相等,即,LDA还可以用于高维数据的降维,具体介绍可参考文章PCA与LDA介绍
具体的推导和计算过程与朴素贝叶斯并没有本质区别,这里就不再详述了,感兴趣的可以参考The Elements of Statistical Learning(2nd Edition) P106-P111