近日,金融与统计学院统计与数据科学系王小燕教授和2021级博士研究生冮建伟合作的题为“多源异质数据下深度神经网络的整合分析及其应用”的论文发表在《统计研究》2025年第2期。
该文针对多源异质数据,提出深度神经网络整合分析模型(IADNN)。该模型建立了L1-CMCP惩罚,以识别重要特征以及处理数据的异质性,其中外层MCP识别对多源数据集整体显著的特征;中层MCP识别特征在数据集层面的异质性;内层Lasso识别DNN节点的异质性。这种嵌套设计旨在促进数据集间的信息共享。本文对L1-CMCP进行局部线性近似,再采用近端梯度下降算法进行模型估计。模拟分析表明,IADNN在特征选择和分类预测方面均有良好表现。当多源数据部分异质时,所提方法的F1分数、FPR等评估指标均优于各数据集独立建模和合并建模的方法;在多源数据完全异质或完全同质时,所提方法取得了与理论最佳模型相近的效果。最后,将IADNN应用于不同经济发展水平地区的信用违约数据,发现该模型在风险指标选择和违约预测方面具备有效性。
王小燕,厦门大学经济学博士,耶鲁大学生物统计系博士后,湖南大学金融与统计学院统计与数据科学系教授。研究领域包括数据挖掘、高维数据分析等。在《统计研究》、《数量经济技术经济研究》、《系统工程理论与实践》、《中国管理科学》、《计量经济学报》、Bioinformatics、Statistics in Medicine、Computational Statistics and Data Analysis、Statistics and Its Interface等国内外学术期刊发表20多篇论文,主持了国家自科基金面上项目、青年项目,教育部人文社科基金青年项目等国家级、省部级课题共9项
。
冮建伟,湖南大学金融与统计学院统计与数据科学系博士研究生。研究领域包括机器学习、高维数据分析等。在《统计研究》、《数量经济技术经济研究》、《经济学动态》、《计量经济学报》等权威期刊发表多篇论文,主持湖南省研究生科研创新项目1项。
读研在金统
金大团