Puppeteer爬虫开发
安装依赖
cnpm install puppeteer -S基本使用
//这里的args参数是因为在Linux服务器环境没有图像渲染的依赖,如果在本地开发,则不需要配置
const browser = await puppeteer.launch({ args: ['--no-sandbox', '--disable-setuid-sandbox'] });
//想象打开一个新的页面
const page = await browser.newPage();
//监听页面的一些行为
page.on('response', msg => {
let stu = msg.status();
let req = msg.request();
let res;
//xhr 看过浏览器控制台network的都明白吧
if (req.resourceType() == 'xhr') {
res = msg.json()
}
if (req.resourceType() == 'xhr' && stu == 200) {
res.then((_res) => {
if (_res.msg == 'ok') {
//_res.url
//这里可以获取到请求的连接
}
})
}
})
//加载链接
await page.goto("这里是要打开的URL");
//完成操作后,关闭浏览器
await browser.close();最后更新于