近日,我院李艳颖教授团队完成的研究论文A new filter feature selection algorithm for classification task by ensembling在国际著名学术期刊Engineering Applications of Artificial Intelligence上发表。该期刊在最新的中国科学院SCI期刊分区表中属于一区期刊,最新影响因子为8.0。我校为该论文独立完成单位,李艳颖教授为唯一通讯作者,论文第一作者为我院2020级应用数学专业硕士研究生龚欢欢。
(Engineering Applications of Artificial Intelligence, 2024, 131, 107865)
特征选择是一种重要的降维预处理技术,它通过获取信息量最大的特征子集来降低数据集的维数,同时最大限度地保留有效数据信息。针对特征之间依赖关系的单一度量方法,论文提出基于对称不确定性和皮尔逊相关系数的集成特征选择算法,该算法从线性和非线性两方面度量了特征之间的相关性。算法首先使用信息增益寻找与类变量相关性最高的一个特征,将信息增益值最高的特征添加到最终子集中。然后选择每次迭代满足新的评价函数最大的特征加入到最终子集中,直至达到停止标准为止。所提算法能有效选择出与类变量强相关、与其他已选特征低冗余的特征子集。在二十个公开数据集上的实验结果表明,所提方法获得的最终特征子集在大多数数据集上具有优异的分类性能,且与其他广泛使用的监督特征选择算法相比,数据维度的约减率更高。(文、李艳颖 审核人、刘淳安)
引用格式:H.Gong, Y. Li,J.Zhang,et. al.Engineering Applications of Artificial Intelligence[J].Engineering Applications of Artificial Intelligence, 2024, 131: 107865.
原文链接:
https://www.sciencedirect.com/science/article/abs/pii/S095219762400023X