千家信息网

Node中如何用Puppeteer库生成海报

发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,这篇文章主要介绍"Node中如何用Puppeteer库生成海报",在日常操作中,相信很多人在Node中如何用Puppeteer库生成海报问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希
千家信息网最后更新 2025年02月04日Node中如何用Puppeteer库生成海报

这篇文章主要介绍"Node中如何用Puppeteer库生成海报",在日常操作中,相信很多人在Node中如何用Puppeteer库生成海报问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Node中如何用Puppeteer库生成海报"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

之前文章写了一下前几天因为使用了 html2canvas 碰到了很多兼容性问题,差点提桶跑路。然后经过评论区大佬们指导,发现了一个操作简单,复用性高的海报生成方案-- Node+Puppeteer生成海报

主要的设计思路为:访问生成海报的接口,接口通过Puppeteer去访问传入的地址,将对应的元素截图返回。

Puppeteer 生成海报相对于 Canvas 生成的优势有哪些:

  • 没有浏览器兼容,平台兼容等问题。

  • 代码复用性高,h6、小程序、app的生成海报服务都可以使用。

  • 优化操作空间更大。因为改成了接口生成海报的形式,可以使用各种服务端的方式去优化响应速度,比如:加服务器、加缓存

puppeteer介绍

Puppeteer 是一个 Nodejs 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome。Puppeteer 默认以 headless 模式运行即"无头"模式,但是可以通过修改配置 headless:false 运行"有头"模式。 在浏览器中手动执行的绝大多数操作都可以使用 Puppeteer 来完成! 下面是一些示例:

  • 生成页面 PDF或者截图。

  • 抓取 SPA(单页应用)并生成预渲染内容(即"SSR"(服务器端渲染))。

  • 自动提交表单,进行 UI 测试,键盘输入等。

  • 创建一个时时更新的自动化测试环境。 使用最新的 JavaScript 和浏览器功能直接在最新版本的Chrome中执行测试。

  • 捕获网站的 timeline trace,用来帮助分析性能问题。

  • 测试浏览器扩展。

方案实现

1. 写一个简单的接口

Express 是一个简洁而灵活的 node.js Web应用框架。使用express写一个简单的node服务,定义一个接口,接收截图所需的配置项传递给puppeteer。

const express = require('express')const createError = require("http-errors")const app = express()// 中间件--json化入参app.use(express.json())app.post('/api/getShareImg', (req, res) => {    // 业务逻辑})// 错误拦截app.use(function(req, res, next) {    next(createError(404));});app.use(function(err, req, res, next) {    let result = {        code: 0,        msg: err.message,        err: err.stack    }    res.status(err.status || 500).json(result)})// 启动服务监听7000端口const server = app.listen(7000, '0.0.0.0', () => {    const host = server.address().address;    const port = server.address().port;    console.log('app start listening at http://%s:%s', host, port);});

2. 创建一个截图模块

打开一个浏览器 => 打开一个标签页 => 截图 => 关闭浏览器

const puppeteer = require("puppeteer");module.exports = async (opt) => {    try {        const browser = await puppeteer.launch();        const page = await browser.newPage();        await page.goto(opt.url, {            waitUntil: ['networkidle0']        });        await page.setViewport({            width: opt.width,            height: opt.height,        });        const ele = await page.$(opt.ele);        const base64 = await ele.screenshot({            fullPage: false,            omitBackground: true,            encoding: 'base64'        });        await browser.close();        return _'data:image/png;base64,'+ base64    } catch (error) {        throw error    }};
  • puppeteer.launch([options]):启动一个浏览器

  • browser.newPage():创建一个标签页

  • page.goto(url[, options]):导航到某个页面

  • page.setViewport(viewport):制定打开页面的窗口

  • page.$(selector):元素选择

  • elementHandle.screenshot([options]):截图。其中encoding属性可以指定返回值是base64或Buffer

  • browser.close():关闭浏览器及标签页

3. 优化

1. 请求时间优化

page.goto(url[, options]) 方法的配置项 waitUntil 表示什么状态下算执行完毕, 默认是load事件触发时。事件包括:

 await page.goto(url, {     waitUntil: [         'load', //页面"load" 事件触发         'domcontentloaded', //页面 "DOMcontentloaded" 事件触发         'networkidle0', //在 500ms 内没有任何网络连接         'networkidle2' //在 500ms 内网络连接个数不超过 2 个     ] });

如果使用 networkidle0 的方案等待页面完成,会发现接口的响应时间会比较长, 因为 networkidle0 需要等待500ms,真实业务场景下很多情况下不需要等待,所以可以封装一个延时器,可以自定义等待时间。比如我们的海报页只是渲染一个背景图跟一个二维码图片,页面触发 load 时已经加载完成了,不需要等待时间,可以传入0跳过等待时间。

 const waitTime = (n) => new Promise((r) => setTimeout(r, n)); //省略部分代码 await page.goto(opt.url); await waitTime(opt.waitTime || 0);

如果这种方式不能满足,需要页面在某个时机通知puppeteer结束,还可以使用 page.waitForSelector(selector[, options]) 等待页面某个指定的元素出现。比如:页面执行完某个操作时,插入一个 id="end" 的元素,puppereer 等待这个元素出现。

 await page.waitForSelector("#end")

类似的方法共包括:

  • page.waitForXPath(xpath[, options]):等待 xPath 对应的元素出现在页面中。

  • page.waitForSelector(selector[, options]):等待指定的选择器匹配的元素出现在页面中,如果调用此方法时已经有匹配的元素,那么此方法立即返回。

  • page.waitForResponse(urlOrPredicate[, options]):等待指定的响应结束。

  • page.waitForRequest(urlOrPredicate[, options]):等待指定的响应出现。

  • page.waitForFunction(pageFunction[, options[, ...args]]):等待某个方法执行。

  • page.waitFor(selectorOrFunctionOrTimeout[, options[, ...args]]):此方法相当于上面几个方法的选择器,根据第一个参数的不同结果不同,比如:传入一个string类型,会判断是不是xpath或者selector,此时相当于waitForXPath或waitForSelector。

2. 启动项优化

Chromium启动时还会开启很多不需要的功能,可以通过参数禁用某些启动项。

    const browser = await puppeteer.launch({        headless: true,        slowMo: 0,        args: [            '--no-zygote',            '--no-sandbox',            '--disable-gpu',            '--no-first-run',            '--single-process',            '--disable-extensions',            "--disable-xss-auditor",            '--disable-dev-shm-usage',            '--disable-popup-blocking',            '--disable-setuid-sandbox',            '--disable-accelerated-2d-canvas',            '--enable-features=NetworkService',        ]    });

3. 复用浏览器

因为每次接口被调用都启动了一个浏览器,截图之后关闭了这个浏览器,造成了资源的浪费,并且启动浏览器也需要耗费时间。并且同时启动的浏览器过多,程序还会抛出异常。所以使用了连接池:启动多个浏览器,在其中一个浏览器下创建标签页打开页面,截图完成后只关闭标签页,保留浏览器。下一次请求过来时直接创建标签页,达到复用浏览器的目的。当浏览器使用次数达到一定数目或者一段时间内没有被使用时就关闭这个浏览器。 有大佬已经对generic-pool这个连接池进行了处理,我就直接拿来用了。

const initPuppeteerPool = () => { if (global.pp) global.pp.drain().then(() => global.pp.clear()) const opt = {   max: 4,//最多产生多少个puppeteer实例 。   min: 1,//保证池中最少有多少个puppeteer实例存活   testOnBorrow: true,// 在将实例提供给用户之前,池应该验证这些实例。   autostart: false,//是不是需要在池初始化时初始化实例   idleTimeoutMillis: 1000 * 60 * 60,//如果一个实例60分钟都没访问就关掉他   evictionRunIntervalMillis: 1000 * 60 * 3,//每3分钟检查一次实例的访问状态   maxUses: 2048,//自定义的属性:每一个 实例 最大可重用次数。   validator: () => Promise.resolve(true) } const factory = {   create: () =>     puppeteer.launch({       //启动参数参考第二条     }).then(instance => {       instance.useCount = 0;       return instance;     }),   destroy: instance => {     instance.close()   },   validate: instance => {     return opt.validator(instance).then(valid => Promise.resolve(valid && (opt.maxUses <= 0 || instance.useCount < opt.maxUses)));   } }; const pool = genericPool.createPool(factory, opt) const genericAcquire = pool.acquire.bind(pool) // 重写了原有池的消费实例的方法。添加一个实例使用次数的增加 pool.acquire = () =>   genericAcquire().then(instance => {     instance.useCount += 1     return instance   }) pool.use = fn => {   let resource   return pool     .acquire()     .then(r => {       resource = r       return resource     })     .then(fn)     .then(       result => {         // 不管业务方使用实例成功与后都表示一下实例消费完成         pool.release(resource)         return result       },       err => {         pool.release(resource)         throw err       }     ) } return pool;}global.pp = initPuppeteerPool()

4. 优化接口防止图片重复生成

用同一组参数重复调用时每次都会开启一个浏览器进程去截图,可以使用缓存机制优化重复的请求。可以通过传入唯一的key作为标识位(比如用户id+活动id),将图片base64存入redis或者写入内存中。当接口被请求时先查看缓存里是否已经生成过,如果生成过就直接从缓存取。否则就走生成海报的流程。

到此,关于"Node中如何用Puppeteer库生成海报"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

浏览器 浏览 生成 页面 海报 实例 截图 接口 元素 时间 标签 服务 方法 事件 参数 问题 复用 学习 测试 业务 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 武汉大学文献期刊数据库 计算机网络技术博客 软件开发与测试面试问题 软件开发人员书籍 静安区个人数据库销售价格 高速收费站服务器建设项目 2017版数据库计算 武汉淘宝客软件开发 安卓数据库是线程安全的吗 长沙软件开发招聘 软件开发如何组织团队 斗罗封神服务器中的雷鸣阎狱藤 朝阳区创新网络技术服务系统 排序器软件在服务器运行主要功能 软件开发属不属于计算机网络类 鹰潭企业服务器要多少费用 浙江省大学生网络安全专业排名 应届生软件开发工程师自我介绍 dell 420服务器 武汉达梦数据库工作怎么样 考研计算机网络技术 在线代理服务器搭建 软件开发阶段工作量百分比 人民网络安全 重要性 越南网络安全性排名 数据库取两个表数据 无线传感器网络技术物联网 软件开发最需要的语言 光遇游戏服务器ip 网络技术物联网感知层技术
0