知识前置
这个章节的机器学习,其实更像是一种概率论的学习,同时这也是机器学习和数据分析中非常重要的一环。如果学习遇到了困难非常推荐参考张宇考研概率论部分的内容。同时这一章的算法,也是在文本分类中使用的比较多的。
名词解释:
- 先验概率:$P(A)$
- 条件概率:$P(A|B)$
- 后验概率:$P(B|A)$
- 全概率:$P(B) = \sum_{i=1}^n P(A_i)*P(B|A_i)$
- 贝叶斯公式:$P(A|B) = \frac{P(A)P(B|A)}{\sum_{i=1}^n P(B|A_i)P(A_i)}$
概率分布:
- 高斯分布:简单的来说它的分布呈现的是正态分布的样子。参考链接
- 伯努利分布:伯努利分布是0-1分布,简单的来说就是那种仍硬币的概率分布。参考链接
- 多项式分布:是伯努利分布的推广,不再是只有两种情况,有多种情况的概率分布。参考链接
贝叶斯算法的核心思想:
找出在特征出现时,各个标签出现的概率,选择概率最大的作为其分类。