本次要分享的是爬取小米商城主页产品的图片。由于本人也是新手,此次也是来分享一下学习过程。
源码
首先爬虫最主要的便是获取网页的元素(Element),这里我们用到了python的第三方库requests(可以通过pip install requests安装),通过requests.get(url)获取网址的元素,并返回它的text。
然后我们需要对返回的信息进行解析获取图片的url,对此我们需要使用正则表达式。观察html,可以看出我们要找的正则表达式。然后我们通过re.findall()来对html进行匹配,匹配到我们需要的图片url。
导入os,通过os.mkdir()新建一个文件夹,os.chdir(),讲目录移到此目录,最后我们只需要将匹配到的结果进行遍历,并写入就可以了。在此过程中我们可以加入对错误的处理(try,except语句),使得在出现错误时不会中断抛出异常,而是以我们想要的形式告知。
声明:我要去上班所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者magicstone所有,原文出处。若您的权利被侵害,请联系删除。
本文标题:(python爬虫实例100例)(python做游戏)
本文链接:https://www.51qsb.cn/article/m8949.html