标签： openGauss

openGauss持续构筑企业级内核能力，使能行业技术创新

2021年8月21日
openGauss
openGauss持续构筑企业级内核能力，使能行业技术创新已关闭评论

企业级数据库openGauss开源一年以来，社区迅速壮大，生态蓬勃发展，围绕企业级性能、企业级安全、企业级可靠等方面持续加强，并在行业加速落地。目前openGauss成功支撑邮储银行新一代分布式金融核心系统上线，并成功打造同业*的金融核心系统；帮助中华人寿团险核心系统使用鲲鹏全栈替换，实现性能倍增；openGauss基于鲲鹏4路服务器的中国移动数据库性能测试排名*对*。面向未来，openGauss将从国计民生行业数据库应用的*紧迫问题和长远需求出发，不断在核心技术上进行突破，将根扎深，共同打造枝繁叶茂的数据库主流生态。

openGauss面向企业核心业务场景持续创新

推出面向核心业务场景的高可靠特性

金融与运营商在社会经济运行中处于关键基础位置，其核心业务场景，对数据库的性能和稳定性有苛刻的要求。openGauss 将于6月30日发布软硬协同的高可靠特性-RAS故障感知功能，该特性基于鲲鹏*新4路高端服务器和openEuler操作系统，支持在硬件内存发生故障前，及时通知上层OS与数据库，实现数据库故障隔离与快速切换，在核心业务数据库场景业务运行故障无感知，数据安全可控无丢失。

%title插图%num

图1: openGauss基于RAS的高可靠原理图：故障隔离、快速切换

推出多款重量级企业级特性，数据库更快、更稳、更强

此外openGauss社区将持续为企业级用户打造高可用、高性能内核，openGauss将在9月30日的版本中，面向开发者和企业用户发布In-place Update存储引擎、基于Paxos协议的DCF高可用组件以及兼顾TP业务和AP业务的HTAP特性。

In-place Update中文意思为原地更新，是相对于openGauss行引擎当前所采用的Append Update(追加更新)模式的升级。追加更新对于业务中的增、删以及HOT UPDATE(即同一个页面内更新)有很好的表现，但对于跨数据页面的非HOT UPDATE场景，垃圾回收不够高效。而原地更新模式将*新版本的“有效数据”和历史版本的“垃圾数据”分离存储：*新版本的“有效数据”存储在数据页面上，单独开辟一段UNDO空间，用于统一管理历史版本的“垃圾数据”，因此数据空间不会由于频繁更新而膨胀，垃圾回收效率更高（参见图2）。同时可实现基于NUMA-Ware架构的高可扩展UNDO子系统以及基于多版本的索引技术。在这种设计思路下，用户可彻底抛弃原有垃圾数据清理机制，从而使整体系统运行更加平稳，适应更多业务场景和工作负载。

%title插图%num

图2: In-place Update数据存储示意图：数据在原page页，undo通过指针单独管理

Paxos是一种强一致、高可用的分布式一致性协议。对于存在宕机风险的分布式系统来说，在不要求可靠的消息传递下可实现数据强一致，且可容忍消息丢失、延迟、乱序及重复。基于多数派机制的Paxos协议保证了2F+1的容错能力，即2F+1个节点的系统*大允许F个节点同时出现故障。更进一步，Paxos协议具备自仲裁，多数派选主及日志复制能力，使得openGauss在保证数据一致性的同时，在高可用方面可进一步得到增强，包括：

(1)通过自仲裁、多数派选主能力摆脱第三方仲裁组件，*大缩短RTO时间，且可预防任何故障下的脑裂双主；

(2)支持节点同步、同异步混合部署的多集群部署模式；

(3)提升主备间节点日志复制效率，提升系统的*大吞吐能力。借助openGauss的DCF高可用组件，用户不仅可以免去系统脑裂的风险，还可以提升系统性能。

%title插图%num

图3: Paxos原理示意图

HTAP代表了一类数据库应用场景，核心思想在基于一套内核提供TP和AP的混合负载能力，而混合负载的两个核心要素是性能和资源控制。从性能维度，openGauss将基于现有的能力进一步挖掘系统并行执行能力(如SMP)，提升CPU利用率(如动态编译执行)，实现内存内计算(如内存引擎)，这些不同引擎或能力支撑openGauss从容应对不同的负载请求。而资源控制方面通过资源管理流机制实现不同负载间的资源隔离，即彼此间互不影响且资源足够，该方法让各自负载在满足SLA的基础上，有非常好的实时性。HTAP实现了单个系统的多业务负载处理能力，一套数据底座，应对两套业务模型，省去数据迁移的代价。

%title插图%num

图4: HTAP即能进行事物处理，又能进行分析处理

openGauss除了在内核能力上不断推出新特性，同时在社区和生态建设上，携手伙伴一起打造面向分布式场景的高竞争力解决方案。

openGauss通过ShardingSphere分布式中间件，实现线性扩展，*高可达6400数据分片，可以满足业务不断增长的数据规模要求；结合业务流量，可以灵活平滑进行数据节点的扩缩容，智能读写分离，实现分布式数据库的自动负载均衡。而标准化镜像机制确保多环境一致性交付，不仅能够支持多云场景，还能有效降低企业对平台的依赖性。同时这套分布式方案，还能支持强有力的集群管理、运维能力以及多地多中心灵活部署。

共建、共治、共享，打造数据库主流生态

生态是开源库数据库成功的关键因素，openGauss一直就秉持共建、共治、共享的生态策略，携手产业链伙伴，*终实现生态共赢。openGauss不仅代码开源，还通过开源社区运营，让业界的开发者、伙伴能公开透明的参与进来，通过技术委员会、SIG组的形式广泛汇聚业界的技术专家，为openGauss发展提供源源不断的智力支持和思想输入。当前，openGauss社区理事会正在筹备中，预计于下半年成立，是openGauss开源社区主要治理机构。

%title插图%num

图5: 30+企业加入openGauss社区

开源近一年，openGauss得到业界伙伴的强烈的响应和支持，已有6家数据库企业基于openGauss发布商业发行版，下半年会有更多新的企业发布商业发行版。目前，民生银行、中国电信云公司、深信服等30多家企业级用户已加入社区，并在多个关键特性上积*贡献。openGauss还与行业解决方案软件伙伴紧密合作，针对行业场景的特点，联合推出对应解决方案：与深信服推出高性能安全数据库一体化方案、联合SharingSphere社区推出全栈开源的分布式中间件解决方案、联合头部厂商面向降本增效场景推出存算分离方案等，相关联合解决方案均已在行业核心场景实现商用落地。

智能基座、产教融合，为产业界提供丰沛的人才

创新之道，唯在得人。得人只要，必广其途以储之。高校是人才培养的根据地，是人才发展的未来。openGauss联合高校，通过产、学、研、用，打通人才体系建设，通过基础理论对接产业和市场需求构建知识体系，从理论到实践到应用相结合，构建良性人才生态，激发产业持续活力。

目前清华、北大、复旦等50余所著名高校已开设openGauss课程，覆盖数万名学生，另有超过30所院校已确定将在年内开课，未来一年，预计将有超过200所院校在教学中使用openGauss，真正实现产教融合。目前，openGauss已进入全国计算机等级考试。

openGauss逐渐成为数据科学的学术创新平台，清华大学、北京航空航天大学、西北工业大学、西安电子科技大学等数十所高校，均已基于openGauss进行创新型基础研究工作，如AI-native的数据库技术、面向新硬件（ARM多核、TPU/GPU、RDMA、NVM/SCM等）新型数据库技术、云数据库架构研究、面向行业数字化转型的数据及隐私保护、面向嵌入式设备场景的数据库系统等方向研究。

从基础研究、高校合作到产业创新，openGauss社区汇聚高校、产业界的智慧和力量，共同开展数据库基础软件创新突破。openGauss持续聚焦数据库根技术，以开源协作创新，为业界带来持续*的数据库技术与产品；以开放繁盛生态，联合产业链上下游伙伴，让openGauss落地千行百业，助力客户加速数字化转型，共促产业发展和生态繁荣。

PostgreSQL / openGauss 数据库易犯的十个错误

2021年8月21日
openGauss, PostgreSQL
PostgreSQL / openGauss 数据库易犯的十个错误已关闭评论

同时设置日志行前缀和csvlog格式

比较常见的是同时配置下面这两个参数：

log_line_prefix = ‘%m %u %d %p’
log_destination=‘csvlog’

%m是带毫秒的时间戳
%u是用户名
%d是数据库名
%p是进程ID

然后当我们配置为csvlog日志时，日志行的内容项是固定的，所以当我们需要配置日志前缀，精简日志行的内容项时，log_destination不能配置为csvlog。下面是正确的配置：

log_destination=‘stderr’
log_line_prefix = ‘%m %u %d %p’

不符合预期的日志轮换策略

日志轮换策略可以通过log_rotation_size参数按日志文件大小控制或者通过log_rotation_age参数按时间控制，但下面这四个参数需要合理组合使用。

log_filename
log_truncate_on_rotation
log_rotation_age
log_rotation_size

方案一：每天生成一个新的日志文件。

log_filename=‘postgresql-%Y-%m-%d.log’
log_truncate_on_rotation=off
log_rotation_age=1d
log_rotation_size=0

方案二：写满固定大小（如10MB），则进行切换。

log_filename=‘postgresql-%Y-%m-%d_%H%M%S.log’
log_truncate_on_rotation=off
log_rotation_age=0
log_rotation_size=10MB

这种方案我们一般是为了根据时间去查看日志，文件名根据日志量可以设置到时分秒，但这里设置log_rotation_size并不能严格控制固定大小。

方案三：保留固定天数的日志并循环覆盖，例如固定一周或者固定一个月。

log_filename=‘postgresql-%u.log’
log_truncate_on_rotation=on
log_rotation_age=1d
log_rotation_size=0

log_filename常见的通配符变量：

%u是星期的数字表示，范围是[1,7]，1代表星期一
%w也是星期的数字表示，范围是[0,6]，0代表星期天
%d是月份中的天数表示，范围是[01,31]

生产环境第三种方案更合适一些。

同步复制表的序列

看看下面这个例子，我们创建test表使用serial自增序列类型，系统帮我们生成了test_id_seq序列。

postgres=# create table test(id serial primary key,name varchar unique);
CREATE TABLE
postgres=# \d test
Table “public.test”
Column | Type | Collation | Nullable | Default
——–+——————-+———–+———-+———————————-
id | integer | | not null | nextval(‘test_id_seq’::regclass)
name | character varying | | |
Indexes:
“test_pkey” PRIMARY KEY, btree (id)
“test_name_key” UNIQUE CONSTRAINT, btree (name)

当我们复制t_test表时，test表的序列引用也同时复制过来了，可以使用虚拟生成列来解决这个问题。

postgres=# create table t_test(like test including all);
CREATE TABLE
postgres=# \d t_test
Table “public.t_test”
Column | Type | Collation | Nullable | Default
——–+——————-+———–+———-+———————————-
id | integer | | not null | nextval(‘test_id_seq’::regclass)
name | character varying | | |
Indexes:
“t_test_pkey” PRIMARY KEY, btree (id)
“t_test_name_key” UNIQUE CONSTRAINT, btree (name)

openGauss对PG的这个问题做了修复，下面是openGauss复制t_test时，序列按表名做了区分。

omm=# \d t_test
Table “public.t_test”
Column | Type | Modifiers
——–+——————-+—————————————————–
id | integer | not null default nextval(‘t_test_id_seq’::regclass)
name | character varying |
Indexes:
“t_test_pkey” PRIMARY KEY, btree (id) TABLESPACE pg_default
“t_test_name_key” UNIQUE CONSTRAINT, btree (name) TABLESPACE pg_default

跳变的序列值

创建序列seq1，设置cache为10，session A获取下一个值为1。

postgres=# create sequence seq1 cache 10;
CREATE SEQUENCE
postgres=# select nextval(‘seq1’);
nextval
———
1
(1 row)

session B查询获取下一个值为11。

postgres=# select nextval(‘seq1’);
nextval
———
11
(1 row)

序列值插入为了保证连续性，要设置cache为1。

从任意库查询pg_stat_statements模块统计信息

pg_stat_statements模块用来跟踪SQL语句的执行统计信息。我们如果把该模块安装到postgres数据库，就只能连到postgres数据库进行查询，除非其他数据库也安装了该模块，否则会提示报错找不到。

无论任何操作，都需要连接到一个数据库，即使是我们只想创建一个全局的数据库用户，所以选对数据库特别重要。

truncate操作理解为DML语句

log_statement参数控制日志记录级别，有4个选项：none、ddl、mod、all。开启ddl，它会记录create、alter和drop相关的语句，但不记录truncate。

truncate在Oracle中属于DDL语句，在PostgreSQL中属于DML语句。因此，当我们使用DDL日志记录语句时，无法记录到truncate。

认为数据库的owner可以管理其下所有对象

数据库、模式、表都有自己的owner，他们都属于实例中的对象，数据库owner只是具有数据库这个对象的CTc权限。数据库的默认权限为：

允许public角色连接，即允许任何人连接。
不允许除了超级用户和owner之外的任何人在数据库中创建schema。
会自动创建名为public的schema，这个schema的所有权限已经赋予给public角色，即允许任何人在里面创建对象。

schema使用注意事项：schema的owner默认是该schema下的所有对象的owner，但是允许用户在别人的schema下创建对象，所以一个对象的owner和schema的owner可能不同，都有drop对象的权限。

认为public模式下的对象可以互相访问

public模式只是允许任何人在里面创建对象并管理自己的对象，并不能查看别人创建的对象。

创建索引时起名为表名称

单个数据库里，索引和表的名称不能重复，因为他们都属于relation。

postgres=# create index a on a(id);
ERROR: relation “a” already exists

把walsender当作主库

通常我们从操作系统层查看主库有walsender，备库有walreceiver进程，并且walsender进程信息中可以看到备库的IP地址，可以初步判断主备状态正常。

但请注意有walsender进程或者数据库中能查到pg_stat_replication视图并不能断定是主库，仅在一主一备环境可以这样简单判断。下面的图可以看出，虽然有walsender进程，但它也是备库。

%title插图%num

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30