研究意义
在避免使用复杂网络结构刻画属性相关性的前提下,通过寻找相关属性组构建朴素贝叶斯分类器,其中相关属性组之间保持相互独立,而相关属性组内的属性之间保持强相关。属性分组朴素贝叶斯分类器的构建同时考虑了“模型通用性”和“数据适用性”,是从模型和数据两个维度来对朴素贝叶斯分类器独立性假设的缓解,进而达到既提升模型泛化性能又拓展数据表达的目的。
本文工作
本文提出了一种基于属性分组的朴素贝叶斯分类器(Attribute Grouping-Based Naive Bayesian Classifier,简称AG-NBC)构建算法。首先,一个合理的目标函数被设计出来去自动地确定相关属性组,同时可行的优化规则被推导用以获得目标函数的局部最优解;之后,在每个属性相关组上训练一个随机链接函数网用以计算属性相关组对应的联合概率;最后,使用属性相关组联合概率的乘积表示原始条件属性集合对应的联合概率,进而完成对朴素贝叶斯分类器的构建。
实验结果
在30个分类数据集上,我们将AG-NBC的分类精度Accuracy、错分代价AUC、和后验概率估计质量PMSE与另外9种典型的贝叶斯分类器,即NBC、FNBC、TAN、GRAWNB、AODE、WAODE、ICA-NBC、HNB、和CFW进行了对比,统计分析的结果显示AG-NBC能够以更低的错分代价和更优的后验概率估计质量获得更高的分类精度。
文章信息
Yulin HE, Guiliang OU, Philippe FOURNIER-VIGER & Joshua Zhexue HUANG. Attribute Grouping-Based Naive Bayesian Classifier. Sci China Inf Sci, doi: 10.1007/s11432-022-3728-2
原文:https://www.sciengine.com/SCIS/doi/10.1007/s11432-022-3728-2;JSESSIONID=8995b295-92fb-4fe9-932b-04722622ec50
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。