Greenplum Database Documentation
Back to Greenplum Database
Wiki
Doc Index
Greenplum数据库® 6.0文档
管理员指南
Greenplum数据库概念
关于Greenplum的架构
关于管理和监控工具
关于Greenplum数据库中的并发控制
管理事务ID的例子
关于并行数据装载
关于Greenplum数据库中的冗余和故障切换
关于Greenplum数据库中的数据库统计信息
管理一个Greenplum系统
关于Greenplum数据库发布版本号
启动和停止Greenplum数据库
访问数据库
建立一个数据库会话
支持的客户端应用
Greenplum数据库客户端应用
用psql连接
使用PgBouncer连接池
数据库应用接口
连接问题的发现及解决
配置Greenplum数据库系统
关于Greenplum数据库的Master参数和本地参数
设置配置参数
设置本地配置参数
设置Master配置参数
设置系统级别参数
设置数据库级别参数
设置角色级别参数
设置会话级别参数
查看服务器配置参数设置
配置参数种类
启用压缩
启用高可用和数据持久化特征
Greenplum数据库高可用性概述
Segment镜像概述
Master镜像概述
在Greenplum数据库中启用镜像
启用Segment镜像
启用Master镜像
检测故障的Segment
检测故障Segment
检查日志文件
恢复故障Segment
从Segment故障中恢复
当一台Segment主机不可恢复时
恢复故障的Master
在恢复后还原Master镜像
备份和恢复数据库
备份和恢复概述
使用gpbackup和gprestore并行备份
需求和限制
备份或还原中包含的对象
执行基本备份和还原操作
过滤备份或恢复的内容
配置邮件通知
理解备份文件
使用gpbackup和gprestore创建增量备份
关于增量备份集
使用增量备份
将gpbackup和gprestore与BoostFS一起使用
安装BoostFS
使用BoostFS备份和恢复
使用gpbackup存储插件
使用带有gpbackup和gprestore的S3存储插件
备份/恢复存储插件API(Beta版)
backup_data
backup_file
cleanup_plugin_for_backup
cleanup_plugin_for_restore
plugin_api_version
restore_data
restore_file
setup_plugin_for_backup
setup_plugin_for_restore
扩容Greenplum系统
系统扩容概述
规划Greenplum系统扩容
准备并增加节点
初始化新节点
重分布表
移除扩容Schema
监控Greenplum系统
日常系统维护任务
Recommended Monitoring and Maintenance Tasks
管理Greenplum数据库访问
配置客户端认证
使用带TLS/SSL的LDAP认证
使用Kerberos认证
为Linux客户端进行Kerberos配置
为Windows客户端进行Kerberos配置
管理角色与权限
定义数据库对象
创建和管理数据库
创建和管理表空间
创建和管理SCHEMA
创建和管理表
选择表存储模型
对大型表分区
创建和使用序列
在Greenplum数据库中使用索引
创建和管理视图
分布与倾斜
插入, 更新, 和删除数据
查询数据
关于Greenplum的查询处理
关于GPORCA
GPORCA概述
启用和禁用GPORCA
收集根分区统计信息
使用GPORCA时的考虑
GPORCA特性和增强
GPORCA改变的行为
GPORCA的限制
判断被使用的查询优化器
关于统一多级分区表
定义查询
WITH查询(公用表表达式)
使用函数和操作符
使用JSON数据
使用XML数据
使用全文搜索
关于全文搜索
在数据库表中搜索文本
控制文本搜索
文本搜索附加功能
文本搜索解析器
文本搜索词典
文本搜索配置示例
测试和调试文本搜索
文本搜索的GiST和GIN索引
psql支持
限制
查询性能
管理查询生成的溢出文件
查询分析
使用外部数据
定义外部表
file://协议
gpfdist://协议
gpfdists:// 协议
pxf:// 协议
s3:// 协议
使用自定义协议
处理外部表数据中的错误
创建和使用外部Web表
Examples for Creating External Tables
Example 1—Single gpfdist instance on single-NIC machine
Example 2—Multiple gpfdist instances
Example 3—Multiple gpfdists instances
Example 4—Single gpfdist instance with error logging
Example 5—TEXT Format on a Hadoop Distributed File Server
Example 6—Multiple files in CSV format with header rows
Example 7—Readable External Web Table with Script
Example 8—Writable External Table with gpfdist
Example 9—Writable External Web Table with Script
Example 10—Readable and Writable External Tables with XML Transformations
使用PXF访问外部数据
使用外部表访问外部数据
写一个外部数据的包装器
使用Greenplum的并行文件服务器(gpfdist)
装载和卸载数据
使用外部表装载数据
装载和写入非HDFS自定义数据
使用一种自定义格式
导入和导出固定宽度的数据
例子:读取宽度固定的数据
使用一种自定协议
处理装载错误
定义一个带有单行错误隔离的外部表
捕捉行格式化错误并且声明拒绝极限
在错误日志中查看不正确的行
在表之间移动数据
用gpload装载数据
使用PXF访问外部数据
使用gpfdist和gpload转换外部数据
用COPY装载数据
在单行错误隔离模式中运行COPY
优化数据装载和查询性能
从Greenplum数据库卸载数据
定义基于文件的可写外部表
例 1—Greenplum文件服务器(gpfdist)
例 2—Hadoop文件系统(pxf)
定义基于命令的可写外部Web表
为Web或者可写外部表禁用EXECUTE
使用可写外部表卸载数据
使用COPY卸载数据
格式化数据文件
格式化行
格式化列
表示NULL值
转义
在文本格式的文件中转义
在CSV格式的文件中转义
字符编码
自定义数据访问协议实例
安装外部表协议
gpextprotocal.c
性能管理
管理性能
性能问题的常见原因
Greenplum数据库内存总览
管理资源
用资源组进行工作负载管理
使用资源队列
检修性能问题
关于GPORCA
关于GPORCA
在Greenplum数据库中,默认的GPORCA优化器与传统查询优化器共存。
这些小节描述GPORCA的功能和用法:
GPORCA概述
GPORCA扩展了Greenplum数据库传统优化器的规划和优化能力。
启用和禁用GPORCA
默认情况下,Greenplum数据库使用GPORCA来替代传统查询规划器。服务器配置参数可以启用或者禁用GPORCA。
收集根分区统计信息
对于分区表,GPORCA使用表根分区的统计信息来生成查询计划。这些统计信息用于确定联接顺序、拆分和联接聚合节点以及计算查询步骤的成本。相比之下,Postgres规划器使用每个叶分区的统计信息。
使用GPORCA时的考虑
用GPORCA最优化执行查询需要考虑的查询条件。
GPORCA特性和增强
GPORCA是Greenplum的下一代查询优化器,它包括了对特定类型的查询和操作的增强:
GPORCA改变的行为
相比使用传统规划器,启用了GPORCA优化器(默认启用)的Greenplum数据库的行为有些改变。
GPORCA的限制
在Greenplum数据库中使用默认的GPORCA优化器时有一些限制。GPORCA和传统的查询优化器当前并存于Greenplum数据库中,因为GPORCA不支持所有的Greenplum数据库特性。
判断被使用的查询优化器
当GPORCA被启用(默认启用)时,可以判断Greenplum数据库是在使用GPORCA还是退回到传统查询优化器。
关于统一多级分区表
Parent topic:
查询数据