- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用户行为分析中的隐私保护初探
用户行为分析中的隐私保护初探(一) 在用户感知方面,随着消费者维权意识和安全意识的提升,对于手机这种私密性较强的消费品的关注程度日益增强,滥用用户信息进行经营活动会直接导致用户投诉上升和满意度降低,从而造成不利的竞争局面。用户在享受信息服务时产生的隐私数据泄漏的风险发生后,可能给企业带来如下的影响:产生企业信任危机,造成不良的社会影响,对多年树立企业品牌形象和社会责任宗旨照成巨大的冲击;随着法律制度的完善和用户法律意识的增强,一旦用户隐私泄漏,可能不断引起法律纠纷,将使得对业务发展和市场营销工作陷入困境;用户隐私泄漏的将直接降低用户满意度,影响到公司“以用户为中心”移动互联网发展战略;用户信息泄露对位置业务、移动广告业务、个性化信息服务等新业务的开发和运营造成重大的打击,甚至会直接导致的产品的失败。 在政策法规层面,对用户隐私的保护也越来越严格。《欧洲联盟数据保护规章》给个人数据下的定义是:“有关一个人被识别或可识别的自然人的任何信息.包括身体的、生理的、经济的、文化的、社会的。”在国际上一系列关于数据隐私权保护的政府报告、行为指引与示范法当中阐述了若干已被普遍遵守的核心原则,其中著名的公平信息实践就是专注数据隐私保护,它涵盖了数据收集、使用、质量、公开、个体参与和责任等方面的内容。欧盟对用户隐私保护主要是立法的方式,而美国对用户隐私保护则主要是立法和行业自律相结合,这也是为什么Google在美国畅通无阻,而在欧盟经常受到隐私保护结构的质疑,甚至将用户隐私保护作为反垄断的筹码。在国内,目前还没有专门的机构负责个人隐私保护,在立法方面,也只有在刑法修正案中提到“违反国家规定,将本单位在履行职责或者提供服务过程中获得的公民个人信息,出售或者非法提供给他人的…”,具体操作起来比较困难。 中国移动一直承诺自己的企业社会责任,因此开展用户隐私保护策略和技术研究并在实际运营中加以实施非常重要。具体可以从以下几个方面进行: 首先是加强企业内部对各类IT系统的安全管理,严格数据使用的流程,从制度上保证用户信息隐私安全;其次是建立中国移动自己的用户行为分析机构和团队,减少在数据使用层面对外部公司的依赖,将数据利用控制在公司内部,既保证公司精细化运营的顺利进行,又能防范由于外部介入而造成数据泄露;加强对隐私保护数据挖掘等新技术的研究,从技术层面减少数据泄漏的风险,特别是在与第三方进行业务合作时,要采用技术手段确保信息传递安全性和保护用户隐私。 在下一篇文章中,我们将从技术层面进一步探讨用户行为分析中的隐私保护。 用户行为分析中的隐私保护初探(二) 从数据存储的角度看,隐私保护数据挖掘又可以分为集中数据的隐私保护数据挖掘和分布式数据的隐私保护数据挖掘。集中数据的隐私保护数据挖掘主要是针对企业内部IT系统中集中存放的数据在挖掘时进行隐私保护处理,具体包括以下几个步骤:对数据集进行单个数据记录的隐私保护处理,主要是变换操作;对不含单个数据记录隐私信息的数据集加入干扰,生成带干扰数据集;对带干扰数据集进行重构;根据重构后的数据集生成数据集合特征;对数据集合特征完成数据挖掘,获取知识。分布式数据的隐私保护数据挖掘主要是针对企业IT系统与第三方系统数据联合进行数据挖掘的情形,主要是步骤是先对单方的数据集进行单个数据记录的隐私保护,然后在进行数据集或数据集合特征的合并,后续的步骤则与集中数据的隐私保护数据挖掘过程类似。 单个数据记录的隐私保护技术包括随机响应技术、基于阻塞的技术、属性变换技术等,主要目的是让挖掘者无法得知单个数据记录的准确信息。随机响应技术主要用于保护分类算法,即在统计某个特征的分布概率时,利用问题的随机性保护被调查者的隐私,同时又得到准确的分布概率。基于阻塞的技术主要用于关联规则挖掘,这种场景中不适合用错误值来替代原来的真实值,即用类似问号来代替某些数据项的具体数值,实现数据阻塞。属性变换技术则往往应用于聚类算法中,用基于旋转的变换方法来隐藏原始数据,同时,数据经过变换后彼此之间的距离保持不变,从而保证聚类挖掘的正确性。也有用图形学中几何数据转换方法和正交变换等数据方法,应用到对集中数据的属性值改变中,以达到隐私保护的目的。 对于数据集的重构,也与具体的挖掘算法相关:在分类算法中,可以采用基于转移概率矩阵的重构技术,对收集的数据属性值进行变换,而后从变换后的数据中恢复属性值的支持计数来产生决策树。其算法可以适用于非字符型数据和非均匀分布的原始数据,也可以变换标签属性。在关联规则算法中,用随机运算符来变换原始数据,即对每个记录进行独立随机变换,重新推导利用变换后的数据推算项集支持度的公式,由此求出频繁项集并且完成关联规则的挖掘。此随机运算符比统一随机化方法更为安全地保护隐私信息,降低从随机化数据推出原始数据的可能性。 在多方参与数据挖掘时,各方
文档评论(0)