初识爬虫
什么是爬虫?
- 爬虫:就是模拟浏览器向服务端发送请求,然后才响应内容中提取数据的程序。
-
抓包:检测网络请求的过程(看发起了那些请求,请求了那些数据,用什么方式请求,请求标头之类的东西)
网页原理如图:
在python中我们一般使用requests
网络库:requests,第三方库,我们使用requests网络库模拟浏览器发起网络请求。
安装requests库:需要用到pip来下载
命令如下:
pip install requests
觉得下载慢的可以
pip install requests -i https://mirrors.aliyun.com/pypi/simple/
如图:
当下面出现Successfully就是下载好了
简单了解一下常见的操作系统
常见的操作系统一般有:
- windows系统
- Android系统
- ios系统
- linux(centos ubuntu redhat )系统
- macos系统
- unix系统
简单的Python代码实现:
没有回复内容