APP下载

部署Greenplum 数据库

2019-11-26中共贵州省委组织部朱懿邵柱

网络安全和信息化 2019年10期
关键词:环境变量命令集群

中共贵州省委组织部 朱懿 邵柱

Greenplum数据库是建立在postgreSQL基础上的开源标准数据库,它能存储并高效管理庞大的数据量,外部应用通过统一SQL 接口访问数据,内部则由多个服务器组成功能强大的集群协同工作。

Greenplum 数据库不仅可以使用SQL 语句分析结构化数据,还提供了建立在PostgreSQL 基础上的模块和扩展应用,这些模块和扩展应用可用于数据库机器学习、人工智能、地理空间分析等,并且支持使用Python、R、Java、Perl、C、C++语言创建用户自定义函数。

Greenplum 数据库是同类产品中唯一一个拥有大量分发安装包的开源产品,而且随着Greenplum 数据库5.3 版本的发布,在Ubuntu系统上编译生成了完整的安装包,使整个安装过程变得更加简单。Greenplum 数据库(Ubuntu 版)安装包被托管在Ubuntu 的个人软件包文档系统(Personal Package Archive 系统)上。

依托这个包管理机制,社区内的成员可以很方便地发布安装包,任何一个接入互联网的系统都可以安装这些安装包。

图1 添加环境变量

典型环境部署研究

(一)在Ubuntu 系统上安装Greenplum 软件

首先,请确保已经选择好Greenplum支持Ubuntu操作系统版 本。本文撰写时,Greenplum数据库支持的是Ubuntu 16.04LTS(Long Term Support:团队长期支持)版本。

各位读者可以访问Greenplum 官网了解Greenplum 最新支持的操作系统版本,在下面的案例中,本文将以Ubuntu 16.04LTS为例。在Ubuntu 安装完成后的具体操作如下:

1.添加并生效环境变量(命令:vi .bashrc、source bashrc),如图1 所示。

2.关闭防火墙(命令:ufw disable)。

3.添加Greenplum PPA 库到Ubuntu 系 统的更新源地址池(命令:sudo addapt-repository ppa:greenplum/db),如图2 所示。

4.从最近添加的更新源地址池中检索信息,结果显示如图3(命令:sudo apt-get update)。

5.安装Greenplum 数据库软件,结果如图4所 示(命 令:sudo apt-get install greenplum-dboss)。

上述命令将自动在系统上安装Greenplum 数据库软件及所需的所有依赖,并将安装好的软件放在/opt/gpdb 路径中,结果如图5 所示。

图2 更新源地址

图3 更新检索信息

图4 安装数据库软件

图5 自动安装并放在相应路径中

图6 加载环境变量

6.将Greenpl um 软件加载到环境变量中,结果如图6 所示(命令:./opt/gpdb/greenplum_path.sh)。

7.生效系统环境变量(命令:source.bashrc)。

8.通过使用Which 命令进行测试,可以看到软件的安装路径。现在可以将Greenplum 集群配置模板文件复制到本地目录中进行编辑(命令cp $GPHOME/docs/cli_help/gpconfigs/gpinitsystem_singlenode)。

(二)编辑修改gpinitsystem 配置文件

9.创建DATA_DIRECTORY目录(命令:mkdir -p/data/primary1/;mkdir -p/data/primary2/;mkdir-p/data/greenplum/gpdata/gpmaster)。

10.新建hostlist_singlenode 这个文件并在里面保存外部应用访问的主机名称master。

11.对gpinitsystem_singlenode 文件进行如下编辑,如图7 所示:

(1)更新MACHINE_LIST_FILE=./hostlist_singlenode 这一行:

(2)将declare -a DATA_DIRECTORY=(/gpdata1/gpdata2) 改为declare-a DATA_DIRECTORY==(/data/primary1/ /data/primary2/)。

请确保第9 步中的相关目录已创建成功。

(3)将MASTER_HOSTNAME=hostname_of_machine 修改为MASTER_HOSTNAME=master,以用来保存外部应用访问的主机名称,如图8 所示。

(4)更新进入主机的数据目录。

图7 对文件进行编辑

图8 保存主机名称

将MASTER_DIRECTORY=/gpmaster 修改为MASTER_DIRECTORY=data/greenplum/gpdata/gpmaster

通过以上步骤,初始化准备工作已就绪,现在我们关闭文件并开始初始化集群。

通过这些配置,一个master segmengt 主机和两个primary segment 服务器的群集已经部署完成。

在更高级的安装过程中,可以在另一台主机上配置备用 的master 和segment 镜像,数据将会分布式存储在primary segment 之间,同时在mirror segement 中生成primary segement 中的数据的镜像,这一切都是自动完成的。

(三)运行gpinitsystem程序

12.首先,通过执行下面的命令来确保ssh 密钥完成交换(命令:gpssh-exchkeys-fhostlist_singlenode)。

然后,再通过执行下面的命令启动集群(命令:gpinitsystem-cgpinitsystem_singlenode)。在命令执行过程中,该程序请求确认下一步的操作。

以上就是Greenplum 全部的安装步骤,下面你可以创建一个数据库,登录数据库并开始查询信息、插入信息。

注意事项

1.为保证整个安装过程顺利进行,在安装Ubuntu 系统时请注意勾选download updates while installing ubuntu 以 及 install third-party software for graphics and wi-fi hardware,flash,mp3 and other media 两个选项。

2.为保证数据库安装过程顺利,请提前关闭Ubuntu系统的防火墙。

猜你喜欢

环境变量命令集群
管理Windows10的PowerShell命令行使用记录
功能性新材料产业集群加速形成
从桌面右键菜单调用环境变量选项
安装和启动Docker
彻底弄懂Windows 10环境变量
海上小型无人机集群的反制装备需求与应对之策研究
培育世界级汽车产业集群
移防命令下达后
勤快又呆萌的集群机器人
解析Windows10的内部命令