千家信息网

jquery怎么爬取页面数据

发表于:2024-11-30 作者:千家信息网编辑
千家信息网最后更新 2024年11月30日,本篇内容主要讲解"jquery怎么爬取页面数据",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"jquery怎么爬取页面数据"吧!搭建环境:(1)、创建一个文
千家信息网最后更新 2024年11月30日jquery怎么爬取页面数据

本篇内容主要讲解"jquery怎么爬取页面数据",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"jquery怎么爬取页面数据"吧!

  搭建环境:

  (1)、创建一个文件夹,进入并初始化一个package.json文件。

  npm init -y

  (2)、安装相关依赖:

  npm install --save koa? ? npm install --save cheerio //后面会用到,用于抓取页面模块,为服务器特别定制的,快速、灵活、实施的jQuery核心实现

  现在来一个简单的demo热热身。直接上代码(文件名:demo2.js):

  var http=require('http') // Node.js提供了http模块,用于搭建HTTP服务端和客户端

  var url='' //输入任何网址都可以

  http.get(url,function(res){ //发送get请求

  var html=''

  res.on('data',function(data){

  html +=data //字符串的拼接

  })

  res.on('end',function(){

  console.log(html)

  })

  })。on('error',function(){

  console.log('获取资源出错!')

  })

  执行node demo2.js? ?得到结果如下:

  很神奇有木有。然而这不是我们想要的,我们想要的是获取页面里面某一部份的数据。

  这里以 没事影院 的电视剧页面为例。这时候cheerio就派上用场了,前面已经安装过,这里就不再赘述,它的用法其实跟jquery是很相似的。参考?cheerio(百度百科的解释)

  在刚刚的js文件中引入cheerio模块,然后加载所需要的html内容。

  var $=cheerio.load(html)? // 加载需要的html

  为了方便使用,这里封装一个函数:

  functionfilterChapters(html) {var $=cheerio.load(html) //加载需要的html,然后就可以愉快地使用类似jQuery的语法了

  var chapters=$('.movie-item') //在html里寻找需要的资源的class

  var courseData=[] //创建一个数组,用来保存资源

  chapters.each(function(item, index) { //遍历我们的html文档

到此,相信大家对"jquery怎么爬取页面数据"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

0