摘要:在P2P网络借贷中,预测借款的违约概率是用户信用评价的关键,也是借贷平台与投资者关注的重点问题。由于P2P平台所获取的用户财务信息有限,P2P借款信用评价和违约预测面临新的挑战。本文结合P2P平台的信息特点,提出一种融入软信息的网络借款违约预测方法。首先利用主题模型抽取并量化文本软信息中的相关变量,进而分析不同软信息变量对借款违约的影响关系;其次,设计了一种两阶段的变量选择方法对软硬信息进行组合筛选;最后,引入随机森林算法构建融入软信息的违约预测模型,并结合P2P平台的真实数据进行实证分析。结果表明,在P2P借款的违约预测模型中融入有价值的软信息可以提高预测准确率。
关键词:p2p借贷 违约预测 软信息 主题模型 变量选择
单位:
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社