Oracle GoldenGate 快速安装配置实用指南
GoldenGate作为Oracle公司大力发展的核心战略产品,在高可用、容灾、
数据抽取转换方面扮演着越来越重要的作用。goldengate可以做什么,说起来真的太多了,
高可用、容灾、Real-Time数据同步,如果你做过BI,一定知道ETL的工具(datastage、infomatica等),
goldengate也可以做,而且,还有两个很关键的因素,第一,goldengate支持异构的数据库,几乎囊括
了所有的主流数据库,到底哪些呢,
去这里看看吧http://www.oracle.com/technetwork/middleware/goldengate/downloads/index.html,
主流的DB2、mysql、sql server、sysbase都支持。
第二,是oracle大力发展的核心战略产品。
goldengate同步在源端捕获日志,extract日志信息发送到目标端,由目标端的replicat日志应用进程
应用事务,达到数据同步。同时,源端的extract抽取进程也可以选择性配置抽取的trail磁盘文件,
目标端的replicat应用进程也可以选择性配置抽取到的日志的trail文件,防止日志丢失。
类似售前性质的话不多说,
本文精确的介绍了在64位linux环境下oracle对oracle的goldengate安装配置(不区分10g、11g),
本文同时配置了batch模式下的数据初始化过程和online模式的实时数据同步过程,按照本文安装配置
能让你快速的构建goldengate环境,不会有任何问题。
1、环境介绍及准备:
两台装有oracle 10g软件的centos(本文安装配置同样适用于oracle 11g).
源端: IP:192.168.1.201 ORACLE_SID=ggsource
目标端: IP:192.168.1.202 ORACLE_SID=ggtarget
1.配置环境变量:
source:
ORACLE_SID=ggsource
ORACLE_BASE=/u01
ORACLE_HOME=$ORACLE_BASE/oracle
PATH=$ORACLE_HOME/bin:$ORACLE_BASE/gg:$PATH
LD_LIBRARY_PATH=$ORACLE_HOME/lib:$ORACLE_BASE/gg11:$LD_LIBRARY_PATH
export ORACLE_BASE ORACLE_HOME ORACLE_SID PATH LD_LIBRARY_PATH
target:
ORACLE_SID=ggtarget
ORACLE_BASE=/u01
ORACLE_HOME=$ORACLE_BASE/oracle
PATH=$ORACLE_HOME/bin:$ORACLE_BASE/gg:$PATH
LD_LIBRARY_PATH=$ORACLE_HOME/lib:$ORACLE_BASE/gg11:$LD_LIBRARY_PATH
export ORACLE_BASE ORACLE_HOME ORACLE_SID PATH LD_LIBRARY_PATH
其他的没什么,搜索路劲加入了goldengate的安装目录$ORACLE_BASE/gg和LD_LIBRARY_PATH,
(后面在安装goldengate时,我的goldengate产品解压安装在$ORACLE_BASE/gg目录下)
LD_LIBRARY_PATH一定要配置,否则在create subdirs会报如下错误:
[oracle@mycentos02 ~]$ ggsci
ggsci: error while loading shared libraries: libnnz10.so: cannot open shared object file: No such file or directory
2.goldengate下载及安装(需要同时在source机器和target机器安装):
哪里下载?www.oracle.com->middleware->goldengate
怎么安装?goldengate的安装简单到吓人,解压就是安装。将下载到的64位gg for oracle 10g,解压到/u01/gg目录下,
/u01/gg及为我的goldengate安装目录。解压之后,cd到/u01/gg目录下,运行ggsci,在ggsci下面ggsci>create subdirs,
创建goldengate对应的目录,就算安装完成。
GGSCI (mycentos) 1> create subdirs
Creating subdirectories under current directory /u01/gg
Parameter files /u01/gg/dirprm: already exists
Report files /u01/gg/dirrpt: created
Checkpoint files /u01/gg/dirchk: created
Process status files /u01/gg/dirpcs: created
SQL script files /u01/gg/dirsql: created
Database definitions files /u01/gg/dirdef: created
Extract data files /u01/gg/dirdat: created
Temporary files /u01/gg/dirtmp: created
Stdout files /u01/gg/dirout: created
GGSCI (mycentos) 2>
我们看到,在gg的安装目录下面建立了一些目录,这些目录是goldengate运行过程中保存相关信息的目录。譬如,
/u01/gg/dirrpt是report也就是goldengate的报表目录, /u01/gg/dirprm是parameter目录,也就是goldengate
进程的参数配置目录等等,其他的不再一一论述。
至此,goldengate安装完成。
3.在source端增加supplemental log支持:
SQL> alter database add supplemental log data;
Database altered.
SQL> alter system switch logfile;
System altered.
SQL> select supplemental_log_data_min from v$database;
SUPPLEME
--------
YES
SQL>
4.在source端和target端同时创建gguser及其对应的表空间:
SQL> create user gguser identified by oracle default tablespace users quota unlimited on users;
User created.
SQL> grant dba to gguser;
Grant succeeded.
SQL>
5.在source端和target端数据库的gguser用户下创建测试表,并在source端插入初始数据:
source端:
SQL> create table ggtable(id number,name varchar2(50));
Table created.
SQL>
SQL> insert into ggtable values(1,'hunter01');
1 row created.
SQL> insert into ggtable values(2,'hunter02');
1 row created.
SQL> insert into ggtable values(3,'hunter03');
1 row created.
SQL> commit;
Commit complete.
SQL>
target端:
SQL> create table ggtable(id number,name varchar2(50));
Table created.
SQL>
6.在source和target端配置mgr进程,并启动:
manager是goldengate的管理进程,在goldengate运行时必须启动,所以source和target两端都要配置。
GGSCI (mycentos) 2> edit params mgr
GGSCI (mycentos) 3> start mgr
Manager started.
GGSCI (mycentos) 4> info mgr
Manager is running (IP port mycentos.7809).
GGSCI (mycentos) 5>
7.配置goldengate要同步的表:
GGSCI (mycentos) 1> dblogin userid gguser,password oracle
Successfully logged into database.
GGSCI (mycentos) 2> add trandata gguser.ggtable
2014-07-20 15:37:47 WARNING OGG-00869 No unique key is defined for table 'GGTABLE'. All viable columns will be used to represent the key, but may not guarantee uniqueness. KEYCOLS may be used to define the key.
Logging of supplemental redo data enabled for table GGUSER.GGTABLE.
GGSCI (mycentos) 3> info trandata gguser.*
Logging of supplemental redo log data is enabled for table GGUSER.GGTABLE.
Columns supplementally logged for table GGUSER.GGTABLE: ID, NAME.
GGSCI (mycentos) 4>
这里有一个表没有unique key的warning,我们忽略,你也可以给表建立unique key.
8.完成initial load:
goldengate有batch和online两种运行模式,在online模式同步source端的数据之前,需要
初始化target端的数据,当然,如果在goldengate启动运行同步之前你的源和
目标端的数据一致,此步骤可以省略。另外,就算你要在goldengate运行之前初始化两端的数据,
也可以用其他任何的数据复制和同步手段,例如exp/expdp等等。这里,是介绍goldengate的initial
load过程,并且我这里用的是direct load模式,其他模式我不详细列举,有兴趣查阅goldengate的相关
文档:
source端:
配置extract进程并配置该进程参数:
GGSCI (mycentos) 2> add extract einikk,sourceistable
EXTRACT added.
GGSCI (mycentos) 3>
GGSCI (mycentos) 3> edit params einikk
参数文件:
EXTRACT EINIKK
USERID gguser, PASSWORD "oracle"
RMTHOST 192.168.1.202, MGRPORT 7809
RMTTASK REPLICAT, GROUP RINIKK
TABLE gguser.ggtable;
其中einikk为抽取的组名称,sourceistable表示是一个initial load的task.
目标端:
配置replicat进程rinikk,并编辑该进程的参数:
add replicat rinikk,specialrun
edit params rinikk
参数文件:
REPLICAT RINIKK
ASSUMETARGETDEFS
USERID gguser, PASSWORD oracle
DISCARDFILE ./dirrpt/RINIKK.dsc, PURGE
MAP gguser.*, TARGET gguser.*;
开始initial load:
启动抽取进程einikk,及进行了initial load的过程:
GGSCI (mycentos) 5> start extract einikk
Sending START request to MANAGER ...
EXTRACT EINIKK starting
我们view report einikk查看einikk的报告,可以看到已经完成了源端数据的初始化,
也就是在目标端插入了初始的三条数据:
Processing table GGUSER.GGTABLE
***********************************************************************
* ** Run Time Statistics ** *
***********************************************************************
Report at 2014-07-20 17:01:13 (activity since 2014-07-20 17:01:03)
Output to RINIKK:
From Table GGUSER.GGTABLE:
# inserts: 3
# updates: 0
# deletes: 0
# discards: 0
至此,initial load过程完成。
9.配置online模式的数据同步:
此过程也就是配置源端的extract进程和目标端的replicat进程.
在源端配置抽取进程eorakk,并配置该进程参数:
GGSCI (mycentos) 7> add extract eorakk,tranlog,begin now,threads 1
EXTRACT added.
GGSCI (mycentos) 8> info extract *
EXTRACT EORAKK Initialized 2014-07-20 17:09 Status STOPPED
Checkpoint Lag 00:00:00 (updated 00:00:13 ago)
Log Read Checkpoint Oracle Redo Logs
2014-07-20 17:09:47 Thread 1, Seqno 0, RBA 0
SCN 0.0 (0)
GGSCI (mycentos) 9>
GGSCI (mycentos) 9> edit params eorakk
EXTRACT EORAKK
USERID system, PASSWORD oracle
RMTHOST 192.168.1.202, MGRPORT 7809
RMTTRAIL ./dirdat/kk
TABLE gguser.ggtable;
在source端增加目标端的trail文件:
add rmttrail ./dirdat/kk,extract eorakk
GGSCI (mycentos) 10> add rmttrail ./dirdat/kk,extract eorakk
RMTTRAIL added.
GGSCI (mycentos) 11> info rmttrail *
Extract Trail: ./dirdat/kk
Extract: EORAKK
Seqno: 0
RBA: 0
File Size: 100M
GGSCI (mycentos) 12>
然后,启动该抽取进程:
GGSCI (mycentos) 12> start extract eorakk
Sending START request to MANAGER ...
EXTRACT EORAKK starting
GGSCI (mycentos) 13> info extract eorakk
EXTRACT EORAKK Last Started 2014-07-20 17:18 Status RUNNING
Checkpoint Lag 00:00:00 (updated 00:00:09 ago)
Log Read Checkpoint Oracle Redo Logs
2014-07-20 17:18:49 Thread 1, Seqno 4, RBA 2489344
SCN 0.578967 (578967)
GGSCI (mycentos) 14>
在目标端配置replicat进程,并启动:
首先,配置checkpoint表:
edit params ./GLOBALS
GGSCI (mycentos02) 1> edit params ./GLoBALS
CHECKPOINTTABLE system.ggchkptable
创建ggchkptable:
GGSCI (mycentos02) 1>dblogin userid system,password oracle
add checkpointtable
这样我们就建立了checkpointtable:system.ggchkptable,我们登陆到目标端的system用户下可以
看到该表:
[oracle@mycentos02 ~]$ sqlplus system/oracle
SQL*Plus: Release 10.2.0.1.0 - Production on Sun Jul 20 05:27:58 2014
Copyright (c) 1982, 2005, Oracle. All rights reserved.
Connected to:
Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - 64bit Production
With the Partitioning, OLAP and Data Mining options
SQL> desc ggchkptable
Name Null? Type
----------------------------------------- -------- ----------------------------
GROUP_NAME NOT NULL VARCHAR2(8)
GROUP_KEY NOT NULL NUMBER(19)
SEQNO NUMBER(10)
RBA NOT NULL NUMBER(19)
AUDIT_TS VARCHAR2(29)
CREATE_TS NOT NULL DATE
LAST_UPDATE_TS NOT NULL DATE
CURRENT_DIR NOT NULL VARCHAR2(255)
LOG_CSN VARCHAR2(129)
LOG_XID VARCHAR2(129)
LOG_CMPLT_CSN VARCHAR2(129)
LOG_CMPLT_XIDS VARCHAR2(2000)
VERSION NUMBER(3)
SQL>
配置replicat进程rorakk,并启动:
GGSCI (mycentos02) 1> add replicat rorakk,exttrail ./dirdat/kk
REPLICAT added.
GGSCI (mycentos02) 2>
参数:
edit params rorakk
REPLICAT RINIKK
ASSUMETARGETDEFS
USERID gguser, PASSWORD oracle
DISCARDFILE ./dirrpt/RINIKK.dsc, PURGE
MAP gguser.*, TARGET gguser.*;
启动:
start replicat rorakk
这样我们就在source端和target端完成了goldengate数据同步的进程,之后我们在
源端的gguser.ggtable表中插入数据时,可以在目标端的数据库中看到能达到数据同步,
同步有多快呢,oracle公司说sub-second。
补充说明:
goldengate的命令可以在ggsci下面输入help进程查看,进程有stop、running和ABENDED状态,
正常运行时是running状态,我在配置过程中,给rorakk进程的参数文件中
USERID gguser, PASSWORD oracle刚开始写错了gguser的密码,并且,start之后,进程在ABENDED,当然也就无法同步数据,
通过查看该进程的report,
view report rorakk:
2014-07-20 05:43:43 ERROR OGG-00664 OCI Error beginning session (status = 1017-ORA-01017: invalid username/password; logon denie
d).
发现了该问题。
另外,在映射表这里,MAP gguser.*, TARGET gguser.*;我也忘记写了TARGET,也可以在该进程的report里面检查到了错误原因:
2014-07-20 06:02:43 ERROR OGG-00212 Invalid option for MAP: gguser.ggtable.
改正了上述两处错误之后,我再次start rorakk,数据立即同步过来了。
总之,遇到错误,要学会查看相关日志和报告,所有的命令,都可以help来查看。