2014广告屏蔽软件开发技术方案.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014广告屏蔽软件开发技术方案

广告屏蔽软件开发技术方案 【摘要】广告、垃圾网页充斥Internet,给用户浏览造成了极大的不方便,而且极大的消耗了网络的带宽以及终端用户系统的资源。本技术方案在参考研究比较大量广告屏蔽技术后,提出了一种基于关键词列表以及BHO(Browser Helper Objects)的垃圾网页过滤方案。 【关键词】垃圾网页 广告屏蔽 BHO HOOK 概述 目前网络上流行的广告技术主要有分为以下三种:弹出式窗口,浮动式窗口以及内嵌式广告图片。大量不必要的信息占满了整个显示区域,使得有效信息的获取变得很难。这些垃圾网页主要都是依靠JavaScript(简称JS)实现的。这种脚本语言是在客户端下载完成后,由客户端的JVM解释执行的。因此它是一种客户端执行的语言,即run at client。其中,弹出式与浮动式窗口主要是由window.open()或者window.showModelessDialog()等创建新窗口等命令完成的。而内嵌式广告图片则是由其编写的一些特效函数做到的。和样式表文件(CSS)相似,这些运行的代码未必直接写道用户所访问的网页之中,他可以通过如script language=javascript src=example.js/script形式的连接隐藏在后台,直接对所下载到的HTML文档进行分析并不能完全有效的屏蔽这些语句。接下来将对国内外研究现状具体的实现技术进行叙述。 国内外研究现状 垃圾网页过滤技术发展到现在已经很成熟了,各大公司的产品的准确率和招回率都已经能达到很高的水准。目前在这个领域比较领先也比较流行的几款软件有Microsoft IE 6.0中自带的网页过滤组件,Maxthon公司的Maxthon以及MyIE2系列浏览器中附加的垃圾网页过滤插件,Google Toolbar也具有网页过滤功能;国内在这领域的软件也有很多,如3721上网助手,雅虎助手以及百度工具栏都有这方面的功能。在大多数软件中用户都可以设置网页过滤的级别,如只过滤弹出网页,过滤浮动窗口,或者过滤所有的广告,包括页面当中的flash动画以及Gif动画。由于上述公司的实现技术相对必威体育官网网址,在相对比较短的时间内很难了解到他们实现的核心技术。但通过这几天对这几款软件的使用与分析,发现他们主要是使用垃圾网页关键词列表技术实现的。如Maxthon浏览器中的广告猎手就维护了一个专家关键词列表。在下载网页并执行其中的JS代码时,浏览器将对JS指定需要下载的连接进行过滤,如有与关键词列表项符合的链接则取消其下载(具体取消方法将在下一章进行介绍),并将所取消的连接写入相应的数据存储文件中,并在过滤网页列表中加入该记录。用户只需双击该条记录就可以重新加载该页面。其他的过滤技术也都大同小异,在此就不再复述了。 实现技术 3.1 预备知识 经过对现存的网络产品的比较,本文将采用基于关键词列表以及BHO的技术实现对垃圾网页的过滤。下面现介绍一下BHO。 BHO(Browser Helper Objects)是浏览器帮助对象,是一种实时组件对象模型(in-process COM)。浏览器将会在每次打开的时候加载它。BHO和浏览器运行在相同的内存区域,并且可以对窗口及其模型作任意的操作。例如,它可以检测到浏览器的后退、前进和文件完成等事件,访问浏览器的菜单和工具栏而且可以进行改动,在当前页面创建窗口等操作,简而言之,BHO就好像一个我们派去的间谍,监视并控制着浏览器的动作。因此我们要进行IE开发,BHO应该是我们最得力的助手。 浏览器访问网页是按照一下这个过程进行的: Navigate-NavigateComplete-DownloadBegin-DownloadComplete-DocumentComplete 我们所使用的BHO就好像钩子(HOOK),可以hook到这些典型的IE事件当中。我们也正是通过控制这些事件进行过滤。 3.2 总体设计 DownloadBegin和DownloadComplete之间的弹出事件,不允许弹出新窗口。 对URL进行过滤,拦截可以网址的下载。 经过对各种方法的比较,本文将采用BHO拦截与URL过滤相结合的方法进行对弹出式窗口的过滤。在BHO中,所有的弹出页面都是通过OnNewWindow2( LPDISPATCH* ppDisp, BOOL* Cancel );打开的。但是如果其第二个参数Cancel = True,浏览器就不可以打开新的窗口了。下面我们看一下浏览器弹出窗口的过程: OnDownloadBegin-发现 window.open等Js或者vbs-OnNewWindow2-OnDownloadComplete 首先在BHO里利用IObjectWithSiteImpl::SetSite获得IWebBrowser2指针In

文档评论(0)

yichao1383 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档