Consul+Prometheus系统监控之注册发现

2018/07 作者:ihunter 0 0


缘起

前面几篇文章分别对系统服务、MySql以及Redis相关软件做了监控预警,但是大家有没有发现,在prometheus.yml里配置需要监听的服务时,我们需要按服务名手动写入,也就是说以后每增加一个服务,就得手动修改此配置,并重启promethues服务。

那么我们如何做到动态的监听服务呢?相信不少接触过分布式框架Dubbo的小伙伴们都知道它是靠zookeeper做注册监听的,最近比较流行的Spring Cloud Netflix的Eureka,consul也是比较常用的注册中心。

参考官方文档consul_sd_config,可以发现promethues已经可以借助consul实现动态监听服务的功能了。

Consul简介

Consul是一个服务发现和注册的工具,其具有分布式、高扩展性能特点。

Consul主要包含如下功能:

  • 服务发现: 支持 http 和 dns 两种协议的服务注册和发现方式。

  • 监控检查: 支持多种方式的健康检查。

  • Key/Value存储: 支持通过HTTP API实现分布式KV数据存储。

  • 多数据中心支持:支持任意数量数据中心。

官方架构图:

Consul.png


使用场景

  • docker 实例的注册与配置共享

  • coreos 实例的注册与配置共享

  • vitess 集群

  • SaaS 应用的配置共享

  • 与 confd 服务集成,动态生成 nginx 和 haproxy 配置文件

优势

  • 使用 Raft 算法来保证一致性, 比复杂的 Paxos 算法更直接. 相比较而言, zookeeper 采用的是 Paxos, 而 etcd 使用的则是 Raft.

  • 支持多数据中心,内外网的服务采用不同的端口进行监听。 多数据中心集群可以避免单数据中心的单点故障,而其部署则需要考虑网络延迟, 分片等情况等. zookeeper 和 etcd 均不提供多数据中心功能的支持.

  • 支持健康检查. etcd 不提供此功能.

  • 支持 http 和 dns 协议接口. zookeeper 的集成较为复杂, etcd 只支持 http 协议.

  • 官方提供web管理界面, etcd 无此功能.

角色

  • client: 客户端, 无状态, 将 HTTP 和 DNS 接口请求转发给局域网内的服务端集群.

  • server: 服务端, 保存配置信息, 高可用集群, 在局域网内与本地客户端通讯, 通过广域网与其他数据中心通讯. 每个数据中心的 server 数量推荐为 3 个或是 5 个.

Consul安装

下载并解压:

## 下载wget  https://releases.hashicorp.com/consul/1.0.0/consul_1.0.0_linux_amd64.zip?_ga=2.31706621.2141899075.1510636997-716462484.1510636997## 解压unzip consul_1.0.0_linux_amd64.zip

以UI形式后台启动:

./consul agent -server -ui -bootstrap-expect 1 -data-dir /tmp/consul &

查看启动状态:

[root@iZ2ze74 home]# ./consul membersNode     Address   Status  Type    Build  Protocol  DC   Segment
iZ2ze74  172.17.120.102:8301  alive   server  1.0.0  2         dc1  

说明:

  • Address:节点地址

  • Status:alive表示节点健康

  • Type:server运行状态是server状态

  • DC:dc1表示该节点属于DataCenter1


查看节点:

curl 127.0.0.1:8500/v1/catalog/nodes

Nginx代理访问:

server {       

  listen       80;        

  server_name  consul.52itstyle.com;        

  charset utf-8;        

  location / {           

   default_type text/html;            

   proxy_pass http://127.0.0.1:8500;       

 }    }


界面:

UI.png

UI.png


服务注册

使用http的方式,直接调用/v1/agent/service/register接口注册:

curl -X PUT -d '{"id": "MySql","name": "MySql","address": "localhost","port": 9104,"tags": ["dev"],"checks": [{"http": "http://localhost:9104/","interval": "5s"}]}'     http://localhost:8500/v1/agent/service/register

使用配置文件注册服务,创建文件夹/etc/consul.d
vi mysql.json内容如下:

{  
  "service":{  
    "id": "mysql",  
    "name": "mysql",  
    "address": "MySql",  
    "port": 9104,  
    "tags": ["dev"],  
    "checks": [  
        {  
            "http": "http://localhost:9104",  
            "interval": "5s"  
        }  
    ]  
  }  
}

指定文件启动:

./consul agent -server -ui -bootstrap-expect 1 -data-dir /tmp/consul   -config-dir /etc/consul.d &

如果文件变更,我们可以通过以下方式重新加载配置:

consul reload

我们也可以通过curl的方式注销服务:

curl  --request PUT  http://localhost:8500/v1/agent/service/deregister/MySql

配置promethues.yml:

global:
  scrape_interval:     15s
  evaluation_interval: 15s
  
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']
        labels:
          instance: prometheus
  - job_name: 'consul'
    consul_sd_configs:
#consul服务地址
      - server: 'localhost:8500'
#services是微服务名的数组,如果什么都不填,则默认取consul上注册的所有微服务
        services: ['redis', 'mysql', 'linux']

然后我们重启promethues,这时候只要Consul有服务注册,promethues就会检测到。

常用命令

常用命令command:

  • agent:运行一个consul agent

  • join:将agent加入到consul cluster

  • members:列出consul cluster集群中的members


常用选项option:

-data-dir

  • 作用:指定agent储存状态的数据目录

  • 这是所有agent都必须的

  • 对于server尤其重要,因为他们必须持久化集群的状态

-config-dir

  • 作用:指定service的配置文件和检查定义所在的位置

  • 通常会指定为"某一个路径/consul.d"(通常情况下,.d表示一系列配置文件存放的目录)

-config-file

  • 作用:指定一个要装载的配置文件

  • 该选项可以配置多次,进而配置多个配置文件(后边的会合并前边的,相同的值覆盖)

-dev

  • 作用:创建一个开发环境下的server节点

  • 该参数配置下,不会有任何持久化操作,即不会有任何数据写入到磁盘

  • 这种模式不能用于生产环境(因为第二条)

-bootstrap-expect

  • 作用:该命令通知consul server我们现在准备加入的server节点个数,该参数是为了延迟日志复制的启动直到我们指定数量的server节点成功的加入后启动。

-node

  • 作用:指定节点在集群中的名称

  • 该名称在集群中必须是唯一的(默认采用机器的host)

  • 推荐:直接采用机器的IP

-bind

  • 作用:指明节点的IP地址

-server

  • 作用:指定节点为server

  • 每个数据中心(DC)的server数推荐为3或5(理想的是,最多不要超过5)

  • 所有的server都采用raft一致性算法来确保事务的一致性和线性化,事务修改了集群的状态,且集群的状态保存在每一台server上保证可用性

  • server也是与其他DC交互的门面(gateway)

-client

  • 作用:指定节点为client

  • 若不指定为-server,其实就是-client

-join

  • 作用:将节点加入到集群

参考链接

https://www.consul.io

https://www.consul.io/api/

http://consul.la/intro/what-is-consul

http://kkkkkk.blog.51cto.com/468162/1914469

https://prometheus.io/docs/prometheus/latest/configuration/configuration/


赞(3) 更多分享

上篇: 【prometheus】- Blackbox_exporter监控web页面
下篇: 从零开始搭建ELK+GPE监控预警系统