国开电大学习网大数据技术综合实训 形考任务答案1答案.pdf

国开电大学习网大数据技术综合实训 形考任务答案1答案.pdf

  1. 1、本文档共3页,其中可免费阅读1页,需付费50金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

网页爬取与内容可视化

一、实训内容

爬取网页数据,提取网页中的中文内容,分词后绘制词云图,以分析网

页内容主题和风格特点。

可选扩展内容:基于BeautifulSoup的网页内容解析、基于宽度优先有哪些信誉好的足球投注网站

与网址提取的多网页内容爬取、基于多网页内容爬取和词云图可视化的网站

主题分析。

二、实训要求

1.了解网页数据的基本格式与网页中文本内容的组织方式。

2.理解python中中文字符编码范围,能够利用给定公式筛选字符串中

的中文内容。

3.掌握基于requests包的网页内容爬取方

文档评论(0)

1tobeing8 + 关注
实名认证
内容提供者

各种学习资料欢迎下载哟!!

1亿VIP精品文档

相关文档