(vba网络爬虫)(vb6爬虫)

前面我有一篇教程,里面说到了用EXCEL 加简单的VBA,爬取多页表格,今天我教大家如何用Excel Powerquery来爬取多页表格,这次的爬取目标还继续用上次的网站:http://www.eiken-kk.com/scripts/eng/eng_kekka.asp?mv=PREVIOUS&rec=31&search=1&tol=1111&val=C-

  1. 新建查询

(vba网络爬虫)(vb6爬虫)

新建查询

2.输入网址然后点确定

(vba网络爬虫)(vb6爬虫)

输入网址

3.网站加载完毕,点击编辑

(vba网络爬虫)(vb6爬虫)

点击编辑

4.点击视图-高级编辑器

(vba网络爬虫)(vb6爬虫)

高级编辑器

5.修改程序

(vba网络爬虫)(vb6爬虫)

程序界面

将上图程序开始和结束的位置分别添加"let GetResults=(URL) =>"和"in GetResults",并将要抓取的网址改为URL,修改后的程序如下

完成后点击已完成。

let GetResults=(URL) =>

let

源 = Web.Page(Web.Contents(URL)),

Data1 = 源{1}[Data],

更改的类型 = Table.TransformColumnTypes(Data1,{{"CLICK", Int64.Type}, {"FILTER TYPE", type text}, {"VIC No.", type text}, {"OEM No.", type text}})

in

更改的类型

in GetResults

6.将名称table1改为vicfilter

(vba网络爬虫)(vb6爬虫)

7.完成后点击关闭后上载

(vba网络爬虫)(vb6爬虫)

点击已完成后

7.在表格中构造112页的网站链接(),并点击数据从表格

(vba网络爬虫)(vb6爬虫)

构造链接

10.点击添加-自定义列

(vba网络爬虫)(vb6爬虫)

添加自定义列

11.输入公式=vicfiter([URL]),点击确定

(vba网络爬虫)(vb6爬虫)

添加自定义列

12.点击继续,并忽略隐私检查,点保存

(vba网络爬虫)(vb6爬虫)

继续

(vba网络爬虫)(vb6爬虫)

隐私检查

13.点击扩展,然后点击确定

(vba网络爬虫)(vb6爬虫)

点击扩展

14.爬取成功,点击关闭并上载 ,速度杠杠的,比VBA的方法快上好几倍

(vba网络爬虫)(vb6爬虫)

爬取完成

好了教程就到这里了,有点长。。。如果有任何错误的地方还望指正,^_^

声明:我要去上班所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者月色微茫所有,原文出处。若您的权利被侵害,请联系删除。

本文标题:(vba网络爬虫)(vb6爬虫)
本文链接:https://www.51qsb.cn/article/m9cyd.html

(0)
打赏微信扫一扫微信扫一扫QQ扫一扫QQ扫一扫
上一篇2023-06-21
下一篇2023-06-21

你可能还想知道

发表回复

登录后才能评论