博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon
阅读量:5783 次
发布时间:2019-06-18

本文共 1038 字,大约阅读时间需要 3 分钟。

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者code的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的NAT网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下LB的流量情况呀?我们现在S3的增长趋势是什么样子的呀?

\"\"

方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装Agent、Zabbix、Open-Falcon等。这些东西怎么监控呢?而且公有云有很多:什么AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?

额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。

小米内部都是用Open-Falcon做监控。Open-Falcon的GitHub地址:

\"\"

Open-Falcon是基于Go开发的一款快速上手、高可用的监控系统,支持自定义Dashboard报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。

Open-Falcon是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给TA了。方案已定,写个Open-Falcon插件。

架构设计

说了这么久,先上架构图:

\"\"

需要支持的云

(1)AWS

(2)阿里云

(3)金山云

监控的资源范围

(1)ELB

(2)EIP

(3)NAT网关

(4)专线

每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。

具体指标信息和含义请自行参照官网:

金山云:

阿里云:

AWS:

代码思路

  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;
  • 获取相应资源的所有列表;
  • 获取列表的相关监控信息;
  • 生成Open-Falcon识别的格式数据,推送到Open-Falcon。

使用指北

该工具已经作为Open-Falcon的插件开源,开源地址:

具体实现代码以及参考文档可以去github查看。

首先把代码clone下来,按照你们的实际情况配置文件,就可以使用啦。

配置文件实例:

\"\"

cloud下面是一个list,可以写的很长很长,想配什么配什么。下面是各项参数说明:

\"\"

至此,小工具分享完啦,希望帮助大家提高效率。

本文转载自公众号“小米运维” (ID: MI-SRE):

你可能感兴趣的文章
感悟贴2016-05-13
查看>>
vim使用教程
查看>>
JDK在LINUX系统平台下的部署案例与总结
查看>>
跨vlan通信-----单臂路由技术
查看>>
百度编辑器ueditor 光标位置的坐标
查看>>
DEV-C++ 调试方法简明图文教程(转)
查看>>
VS2017+EF+Mysql生成实体数据模型(解决闪退的坑)
查看>>
C++多态、继承的简单分析
查看>>
库克称未来苹果用户可自己决定是否降频 网友:你是在搞笑吗?
查看>>
6倍性能差100TB容量,阿里云POLARDB咋实现?
查看>>
linux 安装 MySQLdb for python
查看>>
Sublime Text 2 技巧
查看>>
使用fscanf()函数从磁盘文件读取格式化数据
查看>>
网站一些error_log报错
查看>>
参加婚礼
查看>>
h5 audio相关手册
查看>>
linux命令学习--文件操作
查看>>
vim中代替esc的快捷键
查看>>
JDK文章列表-转载列表
查看>>
umask--设置用户文件和目录的文件创建缺省屏蔽值
查看>>