jquery怎么爬取页面数据
本篇内容主要讲解"jquery怎么爬取页面数据",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"jquery怎么爬取页面数据"吧!
搭建环境:
(1)、创建一个文件夹,进入并初始化一个package.json文件。
npm init -y
(2)、安装相关依赖:
npm install --save koa? ? npm install --save cheerio //后面会用到,用于抓取页面模块,为服务器特别定制的,快速、灵活、实施的jQuery核心实现
现在来一个简单的demo热热身。直接上代码(文件名:demo2.js):
var http=require('http') // Node.js提供了http模块,用于搭建HTTP服务端和客户端
var url='' //输入任何网址都可以
http.get(url,function(res){ //发送get请求
var html=''
res.on('data',function(data){
html +=data //字符串的拼接
})
res.on('end',function(){
console.log(html)
})
})。on('error',function(){
console.log('获取资源出错!')
})
执行node demo2.js? ?得到结果如下:
很神奇有木有。然而这不是我们想要的,我们想要的是获取页面里面某一部份的数据。
这里以 没事影院 的电视剧页面为例。这时候cheerio就派上用场了,前面已经安装过,这里就不再赘述,它的用法其实跟jquery是很相似的。参考?cheerio(百度百科的解释)
在刚刚的js文件中引入cheerio模块,然后加载所需要的html内容。
var $=cheerio.load(html)? // 加载需要的html
为了方便使用,这里封装一个函数:
functionfilterChapters(html) {var $=cheerio.load(html) //加载需要的html,然后就可以愉快地使用类似jQuery的语法了
var chapters=$('.movie-item') //在html里寻找需要的资源的class
var courseData=[] //创建一个数组,用来保存资源
chapters.each(function(item, index) { //遍历我们的html文档
到此,相信大家对"jquery怎么爬取页面数据"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!