JavaEE鸿蒙应用开发HTML&JS+前端Python+大数据开发人工智能开发电商视觉设计软件测试新媒体+短视频直播运营产品经理集成电路应用开发(含嵌入式)Linux云计算+运维开发C/C++拍摄剪辑+短视频制作PMP项目管理认证电商运营Go语言与区块链大数据PHP工程师Android+物联网iOS.NET

Python爬虫入门,180分钟轻松获取疫情数据全部教程

更新日期:2021.06.25

全套视频教程及资料

视频教程技术解析配套源码学习工具学习笔记

一键免费下载

扫码关注,回复关键词,马上领取全套视频资源!

1. 微信扫描二维码,
    关注“黑马程序员”公众号(itheima666)

2. 回复关键词“领取资源01”,

即可在小程序的【人工智能开发】学科中领取全部资源

课程须知

对实现疫情爬虫项目使用到每一个模块逐一讲解, 每个模块都伴随一个案例; 最后水到渠成, 轻松完成疫情爬虫项目。...

  1. 课程介绍
  2. 课程目录
  3. 课程评论

180分钟学会爬虫入门:

1. 了解什么是爬虫

2. 掌握requests库的使用

3. 掌握BeautifulSoup解析库提取数据

4. 掌握正则表达式提取数据

5. 掌握是用json模块处理json格式数据

6. 掌握疫情爬虫项目的实现

7. 了解疫情数据可视化


课程亮点:

1,课程由浅到深,由原理到实践,适合零基础入门学习。

2,结合实际案例,培养解决实际问题的能力。


课程内容:

1. 网络爬虫概述

2. requests请求库

3. BeautifulSoup解析库

4. 正则表达式

5. json模块

6. 疫情爬虫项目

7. 疫情数据可视化介绍


适用人群:

1、对爬虫感兴趣的在校生及应届毕业生。

2、对目前职业有进一步提升要求,希望从事数据行业高薪工作的在职人员。

3、对数据行业感兴趣的相关人员。


课程目录介绍

基础课程主讲内容包括:

阶段一:网络爬虫概述

1. 网络爬虫与浏览器的区别

2. 网络爬虫的概念


阶段二: requests请求库

1. requests介绍与安装

2. requests基本使用

3. 案例: 请求疫情首页


阶段三. BeautifulSoup解析库

1. BeautifulSoup介绍与安装

2. BeautifulSoup对象介绍与创建

3. BeautifulSoup对象的find方法

4. 案例: 从疫情首页提前各国最新的疫情数据


阶段四: 正则表达式

1. 正则表达式的概念与作用

2. 正则表达式的常见语法

3. re.findall() 方法

4. 正则表达式中的r原串的使用

5. 案例: 提取最新的疫情数据的json字符串


阶段五: json模块

 1. json模块介绍

 2. json 转换为 python

 3. python 转换为 json

 4. 案例: 解析最新的疫情数据的json字符串


阶段六: 疫情爬虫项目

 1. 实现 采集最近一日世界各国疫情数据

 2. 实现 采集从01月23日以来的世界各国疫情数据

 3. 实现 采集最近一日全国各省疫情数据

 4. 实现 采集从01月23日以来全国各省疫情数据

 5. 重构 爬虫项目代码


阶段七: 疫情数据可视化

 1. 近一日世界各国疫情数据可视化

 2. 从01月23日以来的世界各国疫情数据可视化

 3. 最近一日全国各省疫情数据可视化

 4. 从01月23日以来全国各省疫情数据可视化


综合评分5.0

5人已评分

我也要评分

评论打分
你觉得老师讲的怎么样?

评论字数不能超过100字,还剩个字符

发表评价

X.南城微凉

https://ncov.dxy.cn/ncovh5/view/pneumonia 这个案例用不了了

0

管理员回复:你是指打不开还是什么情况?

2022-12-23 14:43

嘛嘛嘛码

第15节json格式写入出错问题,打开文件代码增加为:with open('last_day_date.json','w',encoding='utf-8') as fp:可以解决

1

2021-02-19 21:54

嘛嘛嘛码

第九章text = script.text 输出text无结果问题,代码改成text = script.string ,可以解决

2

2021-02-19 15:57

无名者

请问老师为什么第九节的text = script.text然后print(text)结果什么都没有显示。但是直接print(script)可以完整打印。

8

2020-08-23 06:32

阿白

老师讲的非常好

0

2020-08-10 13:56