python爬取下厨房网站首页图片request+bs4
发布时间:2023-11-20 21:10:14 222
相关标签:
注:东西太多,总结的不算太全,系统学习的话,出门右拐B站等你
爬虫:
- 一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。
网页爬取
工具
-
CURL
:cURL是一个利用URL语法在命令行下工作的文件传输工具,1997年首次发行。它支持文件上传和下载,所以是综合传输工具,但按传统,习惯称cURL为下载工具。 - 基本使用方法:
- wget
wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。
python库
- urllib
from urllib import request
urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应
可以看到HTTP响应的头和JSON数据:
urlparse
python3中urlparse模块和urllib模块合并,urlparse()在urllib.parse中进行调用。
urlparse()把url拆分为6个部分,scheme(协议),netloc(域名),path(路径),params(可选参数),query(连接键值对),fragment(特殊锚),并且以元组形式返回。
输出结果
- requests
它是一个Python第三方库,处理URL资源特别方便。
使用requests
文章来源: https://blog.51cto.com/u_15878568/5859635
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
精选文章
中国研究员首次曝光美国国安局顶级后门—“方程式组织”
俄乌线上战争,网络攻击弥漫着数字硝烟
从网络安全角度了解俄罗斯入侵乌克兰的相关事件时间线
下一篇
JavaWeb电影院订票系统(支持在线选座) 2023-11-20 17:52:40