集群管理

Openstack云平台脚本部署之Nagios监控(十九)

2017年11月28日 Openstack, Shell, 云计算, 分布式管理, 集群管理 No comments , , ,

一、简介

Nagios是一款开源分布式监控软件,能够有效监控节点状态,交换机、路由器等网络设置。有关Nagios的监控框架、实现原理及配置文档,详细可阅读这边文章

Nagios功能:

  • 监控网络服务(SMTP、POP3、HTTP、FTP、PING 等);
  • 监控本机及远程主机资[……]

Read more

Openstack云平台脚本部署之Ganglia监控(十八)

2017年11月28日 Openstack, Shell, 分布式管理, 集群管理 No comments , , ,

一、简介

Ganglia是源于UC Berkeley的一个开源分布式监控工具,能够实现对CPU、内存、网络、磁盘I/O等信息的监控,支持Linux、Unix、Windows等多种操作系统,可支持2000左右的节点的网络监控。

Ganglia主要组件包括以下部分:

  • gmetad: g[……]

Read more

虚拟机监控简单脚本

2017年8月7日 Openstack, Python, Shell, 云计算, 集群管理 No comments , ,

1 简介

上周线上的一台运行CAS的虚拟机磁盘满了,导致统一身份认证系统发生故障,问题虽小,但影响范围比较大,教训是深刻的。越发感觉云平台后期运维是多么的重要,建设与之配套的自动化运维平台的对在线业务的实时监控、智能告警具有重要的意义。

2 脚本

由于运维平台尚未建立,这里临时提供一个简单脚本[……]

Read more

Docker初识:将个人博客容器化

2017年7月9日 DevOps, Docker, 博客建设 No comments

一、概述

Docker是一个能够将应用程序自动部署到容器的开源引擎,由Docker公司编写,基于Apache 2.0开源授权协议发行。

Docker是一种轻量级的建模方案,基于”写时复制”(Copy-on-Write)模型构建,目标实现缩短开发、测试、部署的周期,使应用程序具备可移植、易构建[……]

Read more

分布式系统框架调研学习

2017年6月28日 Microservices, MQ, Spring, 分布式管理, 分布式系统, 分布式通信 No comments

一、概述

学习常见的分布式系统架构,主要学习系统的应用场景、关键难点、系统架构、功能模块及部署应用。

以下SOA与微服务的内容主要来自Kim Clark的《微服务、SOA 和 API:是敌是友?》,ESB内容主要来自Zato文档《ESB和SOA到底是什么?》和Mule  ESB文档《What[……]

Read more

RabbitMQ的6种常用场景及客户端使用

2017年4月27日 Java, MQ, 分布式系统, 分布式通信 No comments , ,

一、概述

1、简介

RabbitMQ作为AMQP高级消息队列协议的成熟实现,已经被像Openstack等许多大型项目所采用。本文以Java客户端为例,介绍RabbitMQ的点对点简单队列、多消费者的工作队列、发布/订阅、路由、主题、RPC远程调用6种常用场景。本文主要翻译自RabbitMQ用户文[……]

Read more

Openstack云平台服务开机自启动脚本

2017年4月20日 Ceph, DevOps, Openstack, Pacemaker, 云计算, 集群管理 No comments ,

一、概述

最近用户的机房重启了多次,云平台也因此暂停,云平台自启动脚本的需求随之提上日程。Openstack云平台采用了HA架构部署,底层依赖的服务比较多,云平台重启时所做的工作比较多,故障场景也繁杂,这里先撰写一版比较简单的重启脚本,能够应对一般的服务器重启场景(断电重启、集群正常关闭),主要工[……]

Read more

MariaDB Galera集群自动恢复脚本

2017年4月18日 DevOps, MySQL, Shell, 分布式管理 2 comments ,

一、简介

在《Galera集群恢复的常见七种场景》中详细介绍了其中Galera集群故障的七种恢复场景,除了脑裂场景外(场景七),针对前六种常见恢复场景,撰写Shell脚本check-or-recover-galera.sh进行Galera检测以及故障恢复,该脚本可作为业务系统服务自启动的一部分。[……]

Read more

Openstack云平台脚本部署之Galera高可用集群配置(二)

2017年3月21日 DevOps, MySQL, Openstack, Pacemaker, Shell, 云计算, 集群管理 No comments , ,

一、概述

社区文档中,Openstack的高可用架构采用“Pacemkaer+Haproxy+Galera”的架构,数据库服务的高可用采用Galera同步复制的多主数据库集群,在三个控制节点分别安装MariaDB,然后构建Galera多主集群,数据库后台会进行更新数据的同步复制。使用Haproxy[……]

Read more

Openstack云平台脚本部署之基础环境配置(一)

2017年3月17日 DevOps, Openstack, 云计算, 集群管理 No comments ,

一、关于Shell

对于Openstack平台部署现在有许多强悍的工具,从Devstack、到红帽的RDO、再到Mirantis的Fuel(完全Web化)。另外,配置管理工具也越发的强大,从chef、puppet、saltstack,再到现在酷酷的Ansible,真可谓百花齐放。手工操作->[……]

Read more