- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于修正Sigmoid核的成分数据缺失值填补法-云南民族大学学报
云南民族大学学报:自然科学版,2016,25(6):531-535 CN53-1192/N ISSN1672-8513
doi:12.3969/j.issn.1672-8513.2016.06.010 http://xbynnieducn
基于修正Sigmoid核的成分数据缺失值填补法
程誉莹,张晓琴
(山西大学 数学科学学院,山西 太原030006)
摘要:大多数统计分析方法基于完整的数据集,这些方法不能直接用于包括缺失值的数据集.
此外,由于成分数据的特殊属性,传统的缺失值插补方法直接用于这种类型的数据可能得到不
良的结果.因此,对成分数据而言,缺失值的填补具有十分重要的意义.为了解决这个问题,根
据核函数的性质,提出了一种基于修正Sigmoid核的成分数据缺失值非参数插补方法.该方法使
用模拟和真实的数据集与k近邻插补法和最小二乘迭代回归插补法进行比较.实验结果表明,
新的插补方法可以得到更准确的估计.
关键词:缺失值;成分数据;Sigmoid核函数;非参数填补
中图分类号:O2121 文献标志码:A 文章编号:1672-8513(2016)06-0531-05
[1]
成分数据的概念可以追溯到Ferrers 的工作,D个部分的单形空间定义为:
D
D
S ={ }. (1)
x=(x,x,…,x);x>0,i=1,2,…,D; x=c
1 2 D i ∑j
j=1
D
其中c是一个任意常数,常取为1.如果一个行向量x=(x,x,…,x)属于单形空间S,那么x便叫做一
1 2 D
个成分,维数为D-1.与普通数据相比,成分数据满足“非负性”和“定和性”,因此在成分数据上直接利用
[2]
传统的统计方法会导致一些不合理的结果产生.为了解决这个问题,Aitchison 提出了成分数据含有相对
[3]
信息而非绝对信息,因此每一个成分变量都对应一个比例.Aitchison 提出的对数比变换(alr)和中心对
[4]
数比变换(clr)和之后Egozcue 等在2003年提出的等距对数比变换(ilr)都可以使一个成分数据向量经过
变换得到服从于正态分布的欧氏向量,再经过逆变换变回成分数据,这样便于传统的统计方法的使用.但
是,大多数统计方法是基于完整数据的,并且数据集中存在缺失值变换也不能成功,因此解决成分数据的
缺失值有很大意义.本文的目的是提出一种直接在成分数据中插补缺失值的有效方法.
[5] [6]
目前已有许多插补缺失值的方法,包括均值插补法,EM算法 ,回归插补法,多重插补法 等.但是
[7]
以上方法都是基于欧氏空间上的数据.为了在成分数据中替换缺失值,Martín-Fernández 等于2003年
文档评论(0)