导航：首页 > 服务器 >

prometheus基本概念用法记录

发表于：2025-02-01 作者：千家信息网编辑

千家信息网最后更新 2025年02月01日，Prometheus基本概念promethues是一套开源的系统监控报警框架。 Prometheus 所有采集的监控数据均以指标（metric）的形式保存在内置的时间序列数据库当中（TSDB）：属于

千家信息网最后更新 2025年02月01日prometheus基本概念用法记录

Prometheus

基本概念
promethues是一套开源的系统监控报警框架。
Prometheus 所有采集的监控数据均以指标（metric）的形式保存在内置的时间序列数据库当中（TSDB）：属于同一指标名称，同一标签集合的、有时间戳标记的数据流。除了存储的时间序列，Prometheus 还可以根据查询请求产生临时的、衍生的时间序列作为返回结果。
特点：
- 强大的多为数据模型
- 灵活的查询语言
- 易于管理
- 高效
- 使用pull模式采集时间序列数据
- 多种可视化图形界面
- 易于伸缩
prometheus组成和架构：
- prometheus server: 主要负责数据采集和存储，提供promQL查询语言支持。prometheus是一个时序数据库，将采集到的监控数据按照时间序列的方式存储到本地磁盘。
- Push Gateway: 支持临时性job主动推送指标的中间网关。
- PromDash：使用rails开发的dashboard，用于可视化指标数据。
- Exporters: 负责监控机器运行状态，提供被监控组件信息的 HTTP 接口被叫做 exporter。
  - 直接采集： exporter内置了prometheus支持，直接向prometheus暴露数据端点。
  - 间接采集：原不支持prometheus。通过prometheus提供的clien library编写的目标监控采集程序。
- Altermanager: 从 Prometheus server 端接收到 alerts 后，会进行去除重复数据，分组，并路由到对收的接受方式，发出报警。常见的接收方式有：电子邮件，pagerduty，OpsGenie, webhook 等。
- WebUI:9090提供图形化界面功能。
基本工作原理
- Prometheus server 定期从配置好的 jobs 或者 exporters 中拉 metrics，或者接收来自 Pushgateway 发过来的 metrics，或者从其他的 Prometheus server 中拉 metrics。
- Prometheus server 在本地存储收集到的 metrics，并运行已定义好的 alert.rules，记录新的时间序列或者向 Alertmanager 推送警报。
- Alertmanager 根据配置文件，对接收到的警报进行处理，发出告警。
- 在图形界面中，可视化采集数据。
基本概念：
数据模型：prometheus中存储的数据为时间序列，是由Metric的名字和一系列的标签（键值对）唯一标识的，不同的标签代表不同的时间序列。
样本：实际时间序列，每个序列包括一个float64的值和一个毫秒级的时间戳。（指标+时间戳+样本值）
metric名字：具有语义，表示功能：例如：http_requeststotal, 表示 http 请求的总数。其中，metric 名字由 ASCII 字符，数字，下划线，以及冒号组成，且必须满足正则表达式 [a-zA-Z:][a-zA-Z0-9_:]*。
标签：使一个时间序列有不同未读的识别。例如 http_requeststotal{method="Get"} 表示所有 http 请求中的 Get 请求。当 method="post" 时，则为新的一个 metric。标签中的键由 ASCII 字符，数字，以及下划线组成，且必须满足正则表达式 [a-zA-Z:][a-zA-Z0-9_:]*。
格式：{=, …}，例如：http_requests_total{method="POST",endpoint="/api/tracks"}。
Metric类型
counter: 累加性metirc。
Gauge：可增减性metric
Histogram：树状图
summary：汇总

PromQL查询

数据类型

瞬时向量(instant vector)：一组时间序列，每个时间序列包含单个样本。区间向量(range vector)：一组时间序列，每个时间序列包含一段时间范围内的样本数据。标量(scalar): 一个浮点型数据值。字符串(string): 一个简单的字符串值。

时间序列过滤器

瞬时向量过滤器：eg: http_requests_total ，通过{}里附件一组标签过滤时间序列。标签匹配云算符：  = : 选择与提供的字符串完全相同的标签。  != : 选择与提供的字符串不相同的标签。  =~ : 选择正则表达式与提供的字符串（或子字符串）相匹配的标签。  !~ : 选择正则表达式与提供的字符串（或子字符串）不匹配的标签。区间向量过滤器：eg：http_requests_total{job="prometheus"}[5m]，通过[]指定区间提取数值。时间单位：s - 秒  m - 分钟  h - 小时  d - 天  w - 周  y - 年时间位移操作：在瞬时向量表达式或者区间向量表达式中，都是以当前时间为基准.eg:http_requests_total offset 5m "offset 关键字需要紧跟在选择器（{}）后面"

操作符

算数二次元运算符eg:加减乘除布尔运算符：eg：= ，！= ，< , > ,<= ,>= 集合运算符：and，or，unless匹配模式

聚合操作

语法：([parameter,] ) [without|by ()]  只有count_values, quantile, topk, bottomk支持参数(parameter)sum (求和)；min (最小值)；max (最大值)；avg (平均值)；stddev (标准差)；stdvar (标准差异)；count (计数)；count_values (对 value 进行计数)；bottomk (样本值最小的 k 个元素)；topk (样本值最大的k个元素)；quantile (分布统计)eg:([parameter,] ) [without|by ()]without 用于从计算结果中移除列举的标签，而保留其它标签。by 则正好相反，结果向量中只保留列出的标签，其余标签则移除。通过 without 和 by 可以按照样本的问题对数据进行聚合。

任务和实例
采集不同的监控指标，我们需要运行相应的监控采集程序，并且让prometheus server知道这些export实例的访问地址。每一个监控样本的http服务称之为一个实例。node exporter可以称之为一个实例。
一组用于相同采集目的的实例，或者一个采集进程的多个副本则通过一个一个任务管理。
```
* job: node  * instance 2: 1.2.3.4:9100  * instance 4: 5.6.7.8:9100
```

HTTP API中响应格式

瞬时数据查询：url请求参数：eg:'http://localhost:9090/api/v1/query?query=up&time=2015-07-01T20:10:51.781Z'      query=：PromQL表达式。      time=：用于指定用于计算PromQL的时间戳。可选参数，默认情况下使用当前系统时间。      timeout=：超时设置。可选参数，默认情况下使用-query,timeout的全局设置区间数据查询：url请求参数：eg:'http://localhost:9090/api/v1/query_range?query=up&start=2015-07-01T20:10:30.781Z&end=2015-07-01T20:11:00.781Z&step=15s'query=: PromQL表达式。  start=: 起始时间。  end=: 结束时间。  step=: 查询步长。  timeout=: 超时设置。可选参数，默认情况下使用-query,timeout的全局设置。

Prometheus告警

告警规则定义（Alertrule difinition）

告警名称：自定义名称.

告警规则：基于PromQL表达式定义告警触发条件.定义在配置文件中

 groups: - name: example   rules:   - alert: HighErrorRate     expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5     for: 10m     labels:       severity: page     annotations:       summary: High request latency       description: description info  #group:定义一组相关规则  #alert：告警规则名称  #expr：基于PromQL的触发条件  #for 等待评估时间  #label 自定义标签  #annotation： 指定一组附加信息Alertmanger特性

Altermanager特性

分组：可以将详细的告警机制合并成一个通知 抑制：当发出一个警告时，可以停止重复发送此告警的引发的其他告警机制 静默：将告警进行静默处理

安装启动Altermanger

wget https://github.com/prometheus/alertmanager/releases/download/v0.15.3/alertmanager-0.15.3.linux-amd64.tar.gz cd alertmanager-0.15.3.linux-amd64/ ./alertmanager

altermanager.yml配置文件介绍

 global:   resolve_timeout: 5m route:   group_by: ['alertname']   group_wait: 10s   group_interval: 10s   repeat_interval: 1h   receiver: 'web.hook' receivers: - name: 'web.hook'   webhook_configs:   - url: 'http://127.0.0.1:5001/' inhibit_rules:   - source_match:       severity: 'critical'     target_match:       severity: 'warning'     equal: ['alertname', 'dev', 'instance'] 路由(route)以及接收器(receivers)。所有的告警信息都会从配置中的顶级路由(route)进入路由树，根据路由规则将告警信息发送给相应的接收器。 全局配置（global）：用于定义一些全局的公共参数，如全局的SMTP配置，Slack配置等内容； 模板（templates）：用于定义告警通知时的模板，如HTML模板，邮件模板等； 告警路由（route）：根据标签匹配，确定当前告警应该如何处理； 接收人（receivers）：接收人是一个抽象的概念，它可以是一个邮箱也可以是微信，Slack或者Webhook等，接收人一般配合告警路由使用； 抑制规则（inhibit_rules）：合理设置抑制规则可以减少垃圾告警的产生

重启prometheus
```
killall -9 prometheusnohup prometheus &
```

prometheus 安装

安装prometheus server

wget https://github.com/prometheus/prometheus/releases/download/v2.6.0/prometheus-2.6.0.linux-amd64.tar.gztar -zxvf prometheus-2.6.0.linux-amd64.tar.gzcd prometheus-2.6.0.linux-amd64./prometheus &ln -s /root/prometheus/prometheus-2.6.0.linux-amd64/prometheus /usr/local/bin/prometheus设置开机启动    cat >> /usr/lib/systemd/system/multi-user.target.wants/prometheus.service <

安装Node Exporter 采集主机运行数据(采集主机运行指标比如cpu，内存和磁盘等信息)

wget https://github.com/prometheus/node_exporter/releases/download/v0.17.0/node_exporter-0.17.0.linux-amd64.tar.gztar -zxvf node_exporter-0.17.0.linux-amd64.tar.gz cd node_exporter-0.17.0.linux-amd64/mv node_exporter  /usr/local/bin/nohup  node_exporter &curl -l -H "Content-type: application/json" -X POST -d '{"msgtype": "markdown","markdown": {"title":"Prometheus告警信息","text": "#### 监控指标\n> 监控描述信息\n\n> ###### 告警时间 \n"},"at": {"isAtAll": false}}' https://oapi.dingtalk.com/robot/send?access_token=51345145d106753486bd71614bf881283f91e2124535276b257f99327e41dc87{"errcode":0,"errmsg":"ok"}

Prometheus中添加收集的监控数据，修改prometheus.yml文件，并在scrape_configs添加一下内容。

scrape_configs:- job_name: 'prometheus'  static_configs:    - targets: ['localhost:9090']# 采集node exporter监控数据- job_name: 'node'  static_configs:    - targets: ['localhost:9100']

使用Grafana创建可视化Dashboard

docker run -d -p 3000:3000 grafana/grafana#访问http://localhost:3000 默认用户名admin 密码admin

先记录，后补充。

参考文章如下：

prometheus非官方手册

prometheus-book




         很赞哦！ 
        

        


        时间
            数据
            序列
            标签
            时间序列
            监控
            字符
            表达式
            字符串
            指标
            样本
            配置
            信息
            参数
            向量
            规则
            路由
            查询
            全局
            区间
    
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全

全国一流网络安全学院
java注册数据输入数据库
首都网警网络安全微电影
win7snmp服务器
王者荣耀服务器每天更新时间
上海携程网络技术大楼主要业务
数据库2085安装
ibm服务器风扇异响
校园网络安全宣传意义
小米抢购服务器
软件开发需要考什么资格证
家用云服务器
物流地址数据库
数据库管理证书行业现状
hive数据库截取字符串
高中没毕业能做软件开发工程师吗
邮件服务器如何管理与
东莞卫星软件开发市价
数据库创建后有几个文件
网络技术方向专业包括
浦东新区工商软件开发创新服务
上海携程网络技术大楼主要业务
mc服务器闪退
ipad连接电影服务器异常
国内有做图形软件开发的吗
教师直播都有什么软件开发
软件开发的工作流程软件
sql制作数据库系统吗
软件开发总监的职位
小米贷款无法获取数据库
        
        


        
          
            扫描关注千家信息网微信公众号，第一时间获取内容更新动态
            转载请说明来源于"千家信息网"
            本文地址：https://www.qianjiagd.com/a20814
          
        
        
        
          
            上一篇
              Kubernetes中怎么选Secrets管理器
              Kubernetes中怎么选Secrets管理器，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。Secrets是Kubernetes中一种
              
            下一篇
              rgw用户中的caps指的是什么
              这期内容当中小编将会给大家带来有关rgw用户中的caps指的是什么，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。可以用以下命令为用户添加所有的caps，拥有对应的c




    


    
      
        相关文章
      
      
        recovery是什么意思?电脑开机重启显示recovery蓝屏怎么办
        怎么在Linux中配置SSH和Xshell远程连接服务器
        5分钟入门lsyncd
        基于centos7搭建MySQL数据库
        CentOS 7.7两种方式安装配置JDK 11 LTS
        提高企业开发效率的优质工具：快速开发平台
        Azure实践之如何批量为资源组虚拟机创建alert
        Azure Storage系列之使用AzCopy在blob
        k8s的StatefulSet（有状态服务）实现
        Azure App Service 纵向和横向缩放

 





  
    
      
        站长推荐
        点击排行
      
      
        
          



      recovery是什么意思?电脑开机重启显示recovery蓝屏怎么办
      
        
          怎么在Linux中配置SSH和Xshell远程连接服务器
          
        
          VS2008无法直接查看STL值怎么办
          
        
          什么是RPC框架
          
        
          .net mvc超过了最大请求长度怎么办
          
      
      java怎么实现try/catch异常块
      
        
          PHP中如何处理上传文件
          
        
          php中require_once报错的解决方法
          
        
          PHP如何编写学校网站上新生注册登陆程序
          
        
          php中微信公众号开发模式的示例分析
          
      

          
        
        
          


      在vmware esxi6.5中将硬盘驱动类型由HDD变为SSD类型
     
      
        Vue中的匿名插槽与具名插槽是什么
        vue3与vue2的区别以及vue3的API用法介绍
        录制的横屏视频怎么变成全屏竖屏（录制的横屏怎么变竖屏）
        qq群作业里为什么图片上传不了（qq群作业照片传不上去）
        vscoder如何关闭错误提示
        百度网盘PDF怎么转换成Word格式 PDF转Word操作教程
        老年机号码拉黑怎么解除（老年机号码拉黑怎么解除）
        京东以旧换新评估价和实际一样吗（京东以旧换新估价和成交价一样吗）
      
      拼多多注销后可以重开新用户吗（拼多多注销后重开算新用户吗）
  

          
        
      
    



    
      标签云
      


数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库安全章节测试
华大基因数据库安全性
数据库es安全性测试工具
数据库与云安全
微生物安全数据库
数据库个人信息安全吗
安全数据库降级
黑龙江数据库安全防护系统
数据库安全性实验例题
在国家公共安全数据库有记录


      
    


    

    
      猜你喜欢
      
        微信登录加载联系人失败怎么弄（微信加载联系人失败 点击重试）
        华为手机按键震动在哪设置关掉 按键振动怎么取消方法
        陌陌无限注册教程（怎么注册陌陌新号）
        win10开机蓝屏终止代码SYSTEM_SERVICE_EXCEPTION的解决方法
        微信看不到朋友圈不显示一条横线（微信看不到朋友圈只有一条横线）
        VS2008无法直接查看STL值怎么办
        快影怎么把视频弄成横屏播放 制作方法分享
        拼多多的多多支付怎么解绑银行卡（拼多多的多多支付怎么解绑银行卡）
        怎么将苹果手机中录音发给好友 iPhone传语音文件方法教程
        iis7.5中如何让html与shtml一样支持include功能