利用RFID数据时空冗余性提升数据清洗性能.docVIP

利用RFID数据时空冗余性提升数据清洗性能.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用RFID数据时空冗余性提升数据清洗性能   摘要:无线射频识别(RFID)技术已经大规模应用于许多数据采集方面的应用。然而由于电磁干扰、元器件质量等因素,原始采集的RFID数据通常是低质量的,并且包含许多异常信息。目前已有的RFID数据清洗技术没有完全利用RFID数据的时空冗余性、环境先验知识及应用限制等特征。本文提出了一种基于贝叶斯推理的RFID数据清洗方法,充分利用了数据的冗余性。   关键词:时空冗余性;概率算法;贝叶斯推理;数据清洗   中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2016)29-0232-03   1 引言   RFID是一种允许物体在一定范围内,被自动识别而无需直接观测到的电子标签技术,采用电磁和响应交换[1,2]。目前大量的零售商如沃尔玛、中国EMS、思科在仓库和分发中心的存货系统中安装RFID技术。然而RFID阅读器收集到的数据是不可靠的,中间件系统需要纠正阅读数据并提供清洗过的数据。目前大部分解决方案是清洗一组阅读器采集的数据[3]。然而,已有的方法主要存在三个方面的限制:   1)未利用RFID数据的时空冗余性提高数据的准确性。由大量拥有重复检测区域并且静止的阅读器可产生数据的空间冗余,移动的阅读器在一段时间内持续的数据采集可形成数据的时间冗余。   2)没有有效地利用标签物体和RFID阅读器的先验知识提高数据的准确性。   3)未有效的利用特定应用中的限制(比如一个房间或书架的容量)清洗数据。   本文提出一种考虑到这三种限制的新方法,充分利用数据的冗余性、先验知识和应用限制来提高准确性和数据清洗的有效性。   2 贝叶斯推理框架及n元检测模型   2.1贝叶斯推理框架   首先描述如何基于贝叶斯推理的方法来处理冗余数据和先验知识。贝叶斯推理是根据观察(y)得出假设(x)可能性的统计学方法。贝叶斯推理表明后验知识跟先验知识息息相关,可表示为[pxy∝pyxpx]。   假设在检测环境中有m个区域和n个物体,每个区域中间位置部署一个阅读器。oi表示拥有ID为i的物体。对于每个oi,它的位置表示为一个随机变量hi。因此,n个物体在m个区域可能的分布表示为一个向量[H=h1,h2,…,hn]。hi表示物体oi所在的位置。例如h1=2表示物体o1当前在区域2内。对于区域j中的阅读器,从物体oi标签接受到的未处理的数据(0或1)定义为zij。从m个阅读器每次完全的扫描得到的未处理数据矩阵可以表示为[n×m]阶矩阵[?]=|zij|。那么贝叶斯定理可以如公式(1)所示,其中[postH?]表示根据给定未处理数据[?]得到后验位置矢量[H],假设满足以下约束:如果[H]无效,[postH?]=0;如果[H]有效,[postH?]0;如果[H1]比[H2]可能性大,则[postH1?][postH2?]。如果在未处理数据矩阵中zij=1而实际中物体oi没在区域j中,那么zij就是误报。   为了计算[postH?],假定每个阅读器检测不同的标签是独立的(阅读器成功检测到一个标签不影响它成功检测到另一个标签),可以得到公式(2)。假定不同的hi(物体位置)之间是独立的,并且假定对同一物体每个阅读器的检测是独立的,每个物体的先验分布不依赖于其他物体。由此可得到公式(3)。采用格式化常量[α]重写公式(3)可获得公式(4),对已给定的脏数据[?]和假设[H](每个物体的位置),可以基于公式(4)得到假设的可能性。   我们的目标是创造一个大的有效假设样本集,而有效假设采样的一个先决条件是可以精确计算每个假设的后验概率。   2.2 RFID阅读器检测模型   ?算公式(4)中每个样本的先验概率的关键是准确计算p(zij|hi)的可能性。为此引入n-状态检测模型来精确的计算其可能性。   RFID的物理特性决定其数据采集和传输是不可靠的。阅读器的检测范围可以分为主要检测区域和次要检测区域,其中主要检测区域在距离阅读器较近的范围内,其阅读率可以维持在95%,而次要检测区域的阅读率呈直线下降趋势,超出阅读器的检测范围时,阅读器的阅读率恶化为0。   为了解决这个问题并利用重复的数据,本文提出了一个n-状态检测模型,将阅读器的所有检测区域分成成许多子区域,每一个区域都对应唯一的读取率。不同状态的读取率构成一个等差数列。   为了捕获这种相关性,选择n=3(生成3-状态检测模型)具有更好的可行性。当系统有更多可靠的阅读器就有更少的不确定性,3-状态模型比2-状态在目标定位上提供更多的信息。根据读取率和信息熵之间的关系可以证明,信息熵随着读取率的增大而减小,但是n的取值也不是越大越好,实践应用中3-状态检测是比较理想的模型。   3 具有约束的采样算法

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档