详细说明
本算法主要研究如何利用朴素贝叶斯算法高效过滤特征文本方面垃圾App,通过人工设置训练数据集训练判别垃圾App模型,同时采用人工标记训练数据可以更加准确的对模型进行训练,并根据此训练模型对词语进行判别。由于朴素贝叶斯算法已经假设了数据集属性之间相互独立,故朴素贝叶斯算的逻辑性很简单,同时算法十分稳定,在数据呈现不同的特点时,朴素贝叶斯的分类性能不会有太大的差异。换句话说就是朴素贝叶斯算法的健壮性比较好,在面对不同类型的数据集时不会出现太大的差异。当数据集属性之间的关系相对比较独立时,朴素贝叶斯分类算法会有较好的效果。