摘要:将数据可靠性作为有序变量进行分级,在理论上使数据可靠性与主要生态过程、次级生态过程、外部过程等数据源建立关联,构建了一种生态监测数据质量评估方法,提供了一个新的数据质量指数.它通过观察记录的合格率来估计数据集的质量,其检测结果包括了每一条数据的可靠性级别、标记为离群或错误数据的原因,以及完整数据集的质量指数值.将该方法应用于CERN的两个乔木生长数据集,发现该数据质量指数可以定量评估乔木生长数据集的质量.该方法为相关软件的开发提供了基础.
关键词:数据检测 信息系统 数据质量控制 离群数据
单位:中国科学院沈阳应用生态研究所会同森林生态实验站 沈阳110016 中国科学院植物研究所植被与环境变化国家重点实验室/CERN生物分中心 北京100093 Department of Botany Panjab University Chandigarh 160014 India
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社