简介
Heartbeat 是一个开源程序,为客户端服务器提供集群基础设施功能——集群成员资格和消息传递,这是高可用性(HA)服务器基础设施中的关键组件。通常,Heartbeat 与集群资源管理器(CRM)(如 Pacemaker)一起使用,以实现完整的 HA 设置。但是,在本教程中,我们将演示如何仅使用 Heartbeat 和 DigitalOcean 保留 IP 来创建一个 2 节点 HA 服务器设置。
如果您希望创建更强大的 HA 设置,请考虑使用 Corosync 和 Pacemaker 或 Keepalived。
目标
完成后,HA 设置将由两个 Ubuntu 14.04 服务器组成,处于主/备配置。这将通过将保留 IP 指向主服务器来实现,除非检测到故障。如果 Heartbeat 服务检测到主服务器不可用,次要服务器将自动运行脚本,通过 DigitalOcean API 将保留 IP 重新分配给自己。因此,随后对保留 IP 的网络流量将被定向到您的次要服务器,后者将充当活动服务器,直到主服务器再次可用(此时,主服务器将重新分配保留 IP 给自己)。
!主/备图表
为了实现这个目标,我们将按照以下步骤进行:
创建 2 个将接收流量的 Droplets创建保留 IP 并将其分配给其中一个 Droplet创建指向保留 IP 的 DNS A 记录(可选)在 Droplets 上安装 Heartbeat配置 Heartbeat 以运行保留 IP 重新分配服务创建保留 IP 重新分配服务测试故障转移先决条件
为了自动重新分配保留 IP,我们必须使用 DigitalOcean API。这意味着您需要生成一个个人访问令牌(PAT),这是一个 API 令牌,可用于通过遵循 API 教程中的“如何生成个人访问令牌”部分对您的 DigitalOcean 帐户进行身份验证,具有读取和写入访问权限。您的 PAT 将在添加到集群中的两台服务器上使用,因此请确保将其保存在安全的地方——因为它允许完全访问您的 DigitalOcean 帐户——以供参考。
除了 API,本教程还利用以下 DigitalOcean 功能:
保留 IP元数据用户数据(Cloud-Config 脚本)如果您想了解更多信息,请阅读相关链接的教程。
创建 Droplets
第一步是在同一数据中心创建两个 Ubuntu Droplets,它们将充当上述主服务器和次要服务器。在我们的示例设置中,我们将它们命名为“primary”和“secondary”以便参考。我们将在两个 Droplets 上安装 Nginx,并用唯一标识它们的信息替换它们的索引页面。这将为我们提供一种简单的方法来演示 HA 设置是否正常工作。对于真实设置,您的服务器应该运行您选择的 Web 服务器或负载均衡器。
使用以下 bash 脚本作为用户数据创建两个 Ubuntu 14.04 Droplets,primary 和 secondary:
#!/bin/bashapt-get -y updateapt-get -y install nginxexport HOSTNAME=$(curl -s http://169.254.169.254/metadata/v1/hostname)export PUBLIC_IPV4=$(curl -s http://169.254.169.254/metadata/v1/interfaces/public/0/ipv4/address)echo Droplet: $HOSTNAME, IP Address: $PUBLIC_IPV4 > /usr/share/nginx/html/index.html
这将安装 Nginx 并用 Droplet 的主机名和 IP 地址(通过引用元数据服务)替换 index.html
的内容。通过公共 IP 地址访问任一 Droplet 将显示一个基本网页,其中包含 Droplet 主机名和 IP 地址,这对于测试保留 IP 在任何给定时刻指向哪个 Droplet 将很有用。
创建保留 IP
在 DigitalOcean 控制面板中,点击顶部菜单中的Networking,然后点击侧边菜单中的Reserved IPs。
!无保留 IP
将保留 IP 分配给您的primary Droplet,然后点击分配保留 IP按钮。
分配保留 IP 后,通过在 Web 浏览器中访问它来检查您是否可以访问它所分配的 Droplet。
http://your_reserved_ip
您应该看到您的主要 Droplet 的索引页面。
配置 DNS(可选)
如果您希望通过域名访问您的 HA 设置,请在您的 DNS 中创建一个A 记录,将您的域指向您的保留 IP 地址。如果您的域名使用 DigitalOcean 的域名服务器,请按照“如何在 DigitalOcean 上设置主机名”教程的第三步进行操作。一旦传播完成,您可以通过域名访问您的活动服务器。
我们将使用的示例域名是 example.com
。如果您现在没有域名,您应该使用保留 IP 地址。
安装 Heartbeat
下一步是在两台服务器上安装 Heartbeat。安装 Heartbeat 最简单的方法是使用 apt-get:
sudo apt-get updatesudo apt-get install heartbeat
Heartbeat 现在已经安装,但在它开始工作之前需要进行配置。
配置 Heartbeat
为了启动我们期望的集群,我们必须在两台服务器上的 /etc/ha.d
目录中设置这些 Heartbeat 配置文件:
我们还需要提供一个脚本,以便在主要 Droplet 的可用性发生变化时执行保留 IP 重新分配。
收集节点信息
在配置 ha.cf
之前,我们应该查找每个节点的名称。Heartbeat 要求每个节点名称与它们各自的 uname -n
输出匹配。
在两台服务器上,运行以下命令查找相应的节点名称:
uname -n
记录命令的输出。示例节点名称为 “primary” 和 “secondary”,与我们为 Droplets 命名的名称相匹配。
我们还需要查找每个节点用于与集群的其余部分进行通信的网络接口和 IP 地址,以确定哪些节点是可用的。您可以使用任何网络接口,只要每个节点都可以到达集群中的其他节点即可。我们将使用 Droplets 的公共接口 eth0
。
在两台服务器上,使用以下命令查找 eth0
接口的 IP 地址(或在 DigitalOcean 控制面板中查找):
ip addr show eth0
[secondary_label ip addr show eth0 output:]2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 link/ether 04:01:76:a5:45:01 brd ff:ff:ff:ff:ff:ff inet 104.236.6.11/18 brd 104.236.63.255 scope global eth0 valid_lft forever preferred_lft forever inet 10.17.0.28/16 scope global eth0 valid_lft forever preferred_lft forever inet6 fe80::601:76ff:fea5:4501/64 scope link valid_lft forever preferred_lft forever
记录网络接口的 IP 地址(在示例中突出显示)。确保获取两台服务器的 IP 地址。
创建 ha.cf 文件
在两台服务器上,使用您喜欢的编辑器打开 /etc/ha.d/ha.cf
:
sudo vi /etc/ha.d/ha.cf
文件应该是新的和空的。我们需要在文件中添加集群的网络接口和每个节点的名称。
复制并粘贴以下配置到文件中,然后用我们之前查找到的值替换相应的节点名称和 IP 地址。在这个例子中,primary 的 IP 地址是 104.236.6.11
,secondary 的 IP 地址是 104.236.6.22
:
node primaryucast eth0 104.236.6.11node secondaryucast eth0 104.236.6.22
保存并退出。接下来,我们将设置集群的授权密钥。
创建 authkeys 文件
授权密钥用于允许集群成员加入集群。我们可以简单地为此目的生成一个随机密钥。
在主要节点上,运行以下命令以在名为 AUTH_KEY
的环境变量中生成合适的授权密钥:
if [ -z "${AUTH_KEY}" ]; then export AUTH_KEY="$(command dd if='/dev/urandom' bs=512 count=1 2>'/dev/null' \ | command openssl sha1 \ | command cut --delimiter=' ' --fields=2)"fi
然后使用以下命令将 /etc/ha.d/authkeys
文件写入:
sudo bash -c "{ echo auth1 echo 1 sha1 $AUTH_KEY} > /etc/ha.d/authkeys"
像这样检查 authkeys
文件的内容:
sudo cat /etc/ha.d/authkeys
它应该看起来像这样(具有不同的授权密钥):
[secondary_label /etc/ha.d/authkeys example:]auth11 sha1 d1e6557e2fcb30ff8d4d3ae65b50345fa46a2faa
确保文件只能被 root 读取:
sudo chmod 600 /etc/ha.d/authkeys
现在将主节点的 /etc/ha.d/authkeys
文件复制到次要节点。您可以手动执行此操作,也可以使用 scp
。
在次要服务器上,确保设置 authkeys
文件的权限:
sudo chmod 600 /etc/ha.d/authkeys
两台服务器应该有相同的 /etc/ha.d/authkeys
文件。
创建 haresources 文件
haresources
文件指定了与集群管理的服务配对的首选主机。首选主机是节点,如果该节点可用,则应该运行相关服务。如果首选主机不可用,即集群无法访问该节点,其他节点将接管。换句话说,如果主服务器宕机,辅助服务器将接管。
在两台服务器上,使用你喜欢的编辑器打开 haresources
文件。我们将使用 vi
:
sudo vi /etc/ha.d/haresources
现在在文件中添加以下行,替换为你的主节点名称:
primary floatip
保存并退出。这将配置主服务器为 floatip
服务的首选主机,该服务目前未定义。接下来让我们设置 floatip
服务。
创建保留 IP 重新分配服务
我们的 Heartbeat 集群配置为维护 floatip
服务,节点可以使用该服务将保留 IP 分配给自己,但我们仍然需要创建该服务。然而,在设置服务本身之前,让我们创建一个脚本,该脚本将通过 DigitalOcean API 为运行它的节点分配保留 IP。然后我们将创建 floatip
服务,该服务将运行保留 IP 重新分配脚本。
创建 assign-ip 脚本
在我们的示例中,我们将下载一个基本的 Python 脚本,该脚本使用 DigitalOcean API 为给定的 Droplet ID 分配保留 IP。
在两台服务器上,下载 assign-ip
Python 脚本:
sudo curl -L -o /usr/local/bin/assign-ip http://do.co/assign-ip
在两台服务器上,将其设置为可执行:
sudo chmod +x /usr/local/bin/assign-ip
使用 assign-ip
脚本需要以下详细信息:
DO_TOKEN
传递,你的 DigitalOcean 读/写 PAT 在继续之前,可以随时查看脚本的内容。
现在我们准备创建 floatip
服务。
创建 floatip 服务
要创建 floatip
服务,我们只需要创建一个初始化脚本,该脚本调用我们之前创建的 assign-ip
脚本,并响应 start
和 stop
子命令。此初始化脚本将负责通过 Droplet Metadata 服务查找服务器的 Droplet ID。此外,它将需要将要重新分配的保留 IP 和 DigitalOcean API 令牌(先决条件部分提到的个人访问令牌)。
在两台服务器上,打开 /etc/init.d/floatip
:
sudo vi /etc/init.d/floatip
然后复制并粘贴以下初始化脚本,将突出显示的部分替换为你的 DigitalOcean API 密钥和应重新分配的保留 IP:
#!/bin/bashparam=$1export DO_TOKEN='b7d03a6947b217efb6f3ec3bd3504582'IP='45.55.96.8'ID=$(curl -s http://169.254.169.254/metadata/v1/id)if [ "start" == "$param" ] ; then python /usr/local/bin/assign-ip $IP $ID exit 0elif [ "stop" == "$param" ] ; then exit 0;elif [ "status" == "$param" ] ; then exit 0;else echo "no such command $param" exit 1;fi
保存并退出。
使脚本可执行:
sudo chmod u+x /etc/init.d/floatip
当启动此 floatip
服务时,它将简单地调用 assign-ip
Python 脚本,并将指定的保留 IP 分配给执行该脚本的 Droplet。这是辅助服务器将调用的脚本,以将保留 IP 重新分配给自己,如果主服务器失败。同样,一旦主服务器重新加入集群,相同的脚本将被主服务器使用,以重新获取保留 IP。
启动 Heartbeat
现在 Heartbeat 已配置,并且它所依赖的所有脚本都已设置好,我们准备启动 Heartbeat 集群!
在两台服务器上,运行以下命令以启动 Heartbeat:
sudo service heartbeat start
你应该会看到如下输出:
[secondary_label Heartbeat output:]Starting High-Availability services: Done.
我们的 HA 设置现在已经完成!在继续之前,让我们测试它是否按预期工作。
测试高可用性
测试高可用性设置的工作是非常重要的,让我们现在来做这个测试。
当前,保留 IP 地址被分配给了主节点。现在访问保留 IP,通过 IP 地址或者指向它的域名,将只会显示主服务器的首页。如果你使用了示例用户数据脚本,它会显示如下内容:
[secondary_label 保留 IP 指向主服务器]Droplet: primary, IP 地址: 104.236.6.11
这表明保留 IP 实际上被分配给了主 Droplet。
现在,让我们打开一个终端并使用 curl
每秒访问保留 IP。使用以下命令来执行,但确保用你的域名或保留 IP 地址替换 URL:
while true; do curl http://example.com; sleep 1; done
当前,这将输出主服务器的相同 Droplet 名称和 IP 地址。如果我们导致主服务器失败,比如关闭电源或停止 Heartbeat 服务,我们将看到保留 IP 是否重新分配到次要服务器。
现在让我们关闭主服务器。可以通过 DigitalOcean 控制面板执行此操作,或者在主服务器上运行以下命令:
sudo poweroff
几秒钟后,主服务器应该变得不可用。注意终端中运行的 curl
循环的输出。你应该注意到类似以下的输出:
[secondary_label curl 循环输出:]Droplet: primary, IP 地址: 104.236.6.11...curl: (7) Failed to connect to example.com port 80: Connection refusedDroplet: secondary, IP 地址: 104.236.6.22Droplet: secondary, IP 地址: 104.236.6.22...
也就是说,保留 IP 地址应该被重新分配以指向次要服务器的 IP 地址。这意味着你的高可用性设置正在工作,因为成功的自动故障转移已经发生。
你可能会看到Connection refused
错误,这可能发生在主服务器故障和保留 IP 重新分配完成之间尝试访问保留 IP 时。
现在,你可以通过 DigitalOcean 控制面板重新启动你的主Droplet。因为 Heartbeat 配置了将保留 IP 重新分配脚本运行在主 Droplet 上作为首选主机,保留 IP 一旦再次可用,将自动指向主服务器。
结论
恭喜!现在你已经使用 Heartbeat 和 DigitalOcean 保留 IP 建立了一个基本的高可用性服务器设置。
如果你想创建一个更健壮的高可用性设置,可以考虑使用 Corosync 和 Pacemaker 或 Keepalived。
如果你想扩展你的 Heartbeat 设置,下一步是用反向代理负载均衡器替换示例 Nginx 设置。你可以使用 Nginx 或 HAProxy 来实现这个目的。请记住,你将希望将你的负载均衡器绑定到锚定 IP 地址,这样你的用户只能通过保留 IP 地址访问你的服务器(而不是通过每台服务器的公共 IP 地址)。