前面我有一篇教程,里面说到了用EXCEL 加简单的VBA,爬取多页表格,今天我教大家如何用Excel Powerquery来爬取多页表格,这次的爬取目标还继续用上次的网站:http://www.eiken-kk.com/scripts/eng/eng_kekka.asp?mv=PREVIOUS&rec=31&search=1&tol=1111&val=C-
新建查询
新建查询
2.输入网址然后点确定
输入网址
3.网站加载完毕,点击编辑
点击编辑
4.点击视图-高级编辑器
高级编辑器
5.修改程序
程序界面
将上图程序开始和结束的位置分别添加"let GetResults=(URL) =>"和"in GetResults",并将要抓取的网址改为URL,修改后的程序如下
完成后点击已完成。
let GetResults=(URL) =>
let
源 = Web.Page(Web.Contents(URL)),
Data1 = 源{1}[Data],
更改的类型 = Table.TransformColumnTypes(Data1,{{"CLICK", Int64.Type}, {"FILTER TYPE", type text}, {"VIC No.", type text}, {"OEM No.", type text}})
in
更改的类型
in GetResults
6.将名称table1改为vicfilter
7.完成后点击关闭后上载
点击已完成后
7.在表格中构造112页的网站链接(),并点击数据从表格
构造链接
10.点击添加-自定义列
添加自定义列
11.输入公式=vicfiter([URL]),点击确定
添加自定义列
12.点击继续,并忽略隐私检查,点保存
继续
隐私检查
13.点击扩展,然后点击确定
点击扩展
14.爬取成功,点击关闭并上载 ,速度杠杠的,比VBA的方法快上好几倍
爬取完成
好了教程就到这里了,有点长。。。如果有任何错误的地方还望指正,^_^
声明:我要去上班所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者月色微茫所有,原文出处。若您的权利被侵害,请联系删除。
本文标题:(vba网络爬虫)(vb6爬虫)
本文链接:https://www.51qsb.cn/article/m9cyd.html