实验3-信息获取-guide.docVIP

下载本文档

7
0
约1.69万字
约 15页
2017-12-11 发布于河南
举报
版权申诉

实验3-信息获取-guide.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

实验3-信息获取-guide

Crawler体系结构，绘图不易，黑板上直接画。使用Boost库完成实验需要了解：一线程 1．启动线程 #include?boost/thread/thread.hpp //使用线程必须包括 #include?boost/thread/mutex.hpp //使用线程同步必须包括 #include?boost/bind.hpp //如果希望使用bind函数，必须包括 #include?boost/thread/condition.hpp //如果使用条件变量同步，必须包括 …… boost::mutex?io_mutex; //使用线程同步必须定义全局互斥信号量 …… Void hi() //情况a，线程函数不需要传入数据初始化 Void hi(int xxx) //情况b，线程需要传入数据初始化 ….. int?main(int?argc,?char*?argv[]) { //情况a，线程无需传入数据初始化 boost::thread?thrd(hi); //情况b，线程需要传入数据初始化，使用bind函数完成 boost::thread?thrd(boost::bind(hi,?1)); thrd.join(); ?return?0; } 2. 线程同步 Boost线程库提供了6互斥体类型，按效率排序： boost::mutex, boost::try_mutex,? boost::timed_mutex,? boost::recursive_mutex,? boost::recursive_try_mutex, ? boost::recursive_timed_mutex? #include?boost/thread/thread.hpp //使用线程必须包括 #include?boost/thread/mutex.hpp //使用线程同步必须包括 #include?boost/thread/condition.hpp //如果使用条件变量同步，必须包括 boost::mutex?io_mutex; //使用线程同步必须定义全局互斥信号量 void?count(int?id) { ????????for?(int?i?=?0;?i??10;?++i) ????????{ ????????????????boost::mutex::scoped_lock lock(io_mutex); //加锁 ????????????????std::cout??id??:?? i??std::endl; //操作共享数据 ????????} } int?main(int?argc,?char*?argv[]) { ????????boost::thread?thrd1(boost::bind(count,?1)); ????????boost::thread?thrd2(boost::bind(count,?2)); ????????thrd1.join(); ????????thrd2.join(); ????????return?0; } 有的时候仅仅依靠锁住共享资源来使用它是不够的。有时候共享资源只有某些状态的时候才能够使用。比方说，某个线程如果要从堆栈中读取数据，那么如果栈中没有数据就必须等待数据被压栈。这种情况下的同步使用互斥体是不够的。因为实验准备使用一个dns解析线程和多个crawler线程协同工作，这些crawler线程和dns解析线程需要维护未访问和已访问url列表，这些列表的访问可能有些条件，需要进行判断，那么就需要boost.condition，即条件变量。条件变量的使用总是和互斥体及共享资源联系在一起的。线程首先锁住互斥体，然后检验共享资源的状态是否处于可使用的状态。如果不是，那么线程就要等待条件变量。要指向这样的操作就必须在等待的时候将互斥体解锁，以便其他线程可以访问共享资源并改变其状态。它还得保证从等到得线程返回时互斥体是被上锁得。当另一个线程改变了共享资源的状态时，它就要通知正在等待条件变量得线程，并将之返回等待的线程。下面是一个实现了有界缓存区的类和一个固定大小的先进先出的容器。由于使用了互斥体boost::mutex，这个缓存区是线程安全的。put和get使用条件变量来保证线程等待完成操作所必须的状态。有两个线程被创建，一个在buffer中放入100个整数，另一个将它们从buffer中取出。这个有界的缓存一次只能存放10个整数，所以这两个线程必须周期性的等待另一个线程。为了验证这一点，put和get在std::cout中输出诊断语句。最后，当两个线程结束后，main函数也就执行完毕了#include?boost/thread/thr