Oracle CDC 데이터베이스

Important

Change Data Capture for Oracle by Attunity는 이제 더 이상 사용되지 않습니다. 자세한 내용은 공지를 참조하세요.

Oracle CDC 인스턴스는 대상 SQL Server 인스턴스에서 동일한 이름으로 SQL Server 데이터베이스와 연결됩니다. 이 데이터베이스를 Oracle CDC 데이터베이스(또는 CDC 데이터베이스)라고 합니다.

CDC 데이터베이스는 Oracle CDC Designer 콘솔을 사용하여 만들어지고 구성되며, 포함되는 요소는 다음과 같습니다.

  • 데이터베이스를 SQL Server CDC에 사용하도록 설정하여 만든 cdc 스키마

  • Oracle CDC 인스턴스에서 사용하는 cdc.xdbcdc_xxxx 테이블 세트

  • tuphe 원본 Oracle 데이터베이스에서 캡처된 테이블의 정의가 포함된 빈 미러 테이블 세트

  • SQL Server CDC 메커니즘에 생성되고 Oracle이 아닌 일반 SQL Server CDC에서 사용되는 것과 동일한 변경 테이블 및 변경 액세스 함수 세트

cdc 스키마는 처음에 dbowner 고정 데이터베이스 역할의 멤버만 액세스할 수 있습니다. 변경 테이블 및 변경 기능에 대한 액세스는 SQL Server CDC와 동일한 보안 모델에 의해 결정됩니다. 보안 모델에 대한 자세한 내용은 보안 모델을 참조하세요.

CDC 데이터베이스 만들기

대부분의 경우 CDC 데이터베이스는 CDC Designer 콘솔을 사용하여 만들지만, CDC Designer 콘솔을 통해 생성된 CDC 배포 스크립트를 사용하여 만들 수도 있습니다. SQL Server 시스템 관리자는 필요한 경우 스토리지, 보안 또는 가용성과 같은 항목에 대한 데이터베이스 설정을 변경할 수 있습니다.

CDC Designer 콘솔을 사용하여 데이터베이스 테이블 및 필요한 스크립트를 만드는 방법에 대한 자세한 내용은 새 인스턴스 마법사 사용을 참조하세요.

CDC 데이터베이스 사용자 역할

CDC 데이터베이스를 만들고 CDC에 사용하도록 설정하면 cdc_service라는 데이터베이스 사용자가 CDC 데이터베이스에 만들어지고 Oracle CDC Service가 구성된 SQL Server 로그인과 연결됩니다. 이 사용자는 db_datareader, db_datawriterdb_ddladmin 데이터베이스 역할의 멤버가 됩니다. SQL Server 로그인이 dbo 사용자와도 연결되는 경우 cdc_service 만들어지지 않습니다.

이 역할 할당을 사용하면 Oracle CDC Service에서 캡처된 데이터와 제어 정보를 사용하여 cdc 스키마 아래의 테이블을 업데이트할 수 있습니다.

CDC 데이터베이스가 만들어지고 CDC 원본 Oracle 테이블이 설정된 경우 CDC 데이터베이스 소유자는 미러 테이블의 SELECT 권한을 부여하고 SQL Server CDC 제어 역할을 정의하여 변경 데이터에 액세스하는 사용자를 제어할 수 있습니다.

미러 테이블

Oracle 원본 데이터베이스의 각 캡처된 테이블(<schema-name>.<table-name>)에 대해 동일한 스키마와 테이블 이름을 가진 유사한 빈 테이블이 CDC 데이터베이스에 만들어집니다. SQL Server의 cdc 스키마가 SQL Server CDC용으로 예약되어 있으므로 스키마 이름이 cdc(대/소문자 구분 안 함)인 Oracle 원본 테이블을 캡처할 수 없습니다.

미러 테이블은 비어 있으며 여기에는 데이터가 저장되지 않습니다. 미러 테이블은 Oracle CDC 인스턴스에 사용되는 표준 SQL Server CDC 인프라를 사용하도록 설정하는 데 사용됩니다. 데이터가 미러 테이블에 삽입되거나 업데이트되지 않도록 하려면 PUBLIC에 대한 모든 UPDATE, DELETE 및 INSERT 작업이 거부됩니다. 이렇게 하면 수정할 수 없습니다.

변경 데이터에 대한 액세스

캡처 인스턴스와 연결된 변경 데이터에 대한 액세스 권한을 얻는 데 사용되는 SQL Server 보안 모델로 인해 사용자에게 연결된 미러 테이블의 캡처된 모든 열에 대한 select 액세스 권한이 부여해야 합니다(원래 Oracle 테이블에 대한 액세스 권한은 SQL Server의 변경 테이블에 대한 액세스를 제공하지 않음). SQL Server 보안 모델에 대한 자세한 내용은 보안 모델을 참조하세요.

또한 캡처 인스턴스를 만들 때 게이팅 역할을 지정하는 경우 호출자도 지정된 게이팅 역할의 멤버여야 합니다. 메타데이터에 액세스하는 다른 일반적인 변경 데이터 캡처 함수에 모든 데이터베이스 사용자가 public 역할을 통해 액세스할 수 있습니다. 물론 반환된 메타데이터에 대한 액세스는 기본 원본 테이블에 대한 select 액세스 권한을 사용하거나 정의된 제어 역할에서의 멤버 자격을 통해 일반적으로 제어됩니다.

캡처 인스턴스를 만들 때 SQL Server CDC 구성 요소에 의해 생성된 특수 테이블 기반 함수를 호출하여 변경 데이터를 읽을 수 있습니다. 이 함수에 대한 자세한 내용은 변경 데이터 캡처 함수(Transact-SQL)를 참조하세요.

Integration Services CDC 원본 구성 요소를 통해 CDC 데이터에 액세스하는 경우에 동일한 규칙이 적용됩니다.

CDC 데이터베이스 테이블

이 섹션에서는 CDC 데이터베이스의 다음 테이블에 대해 설명합니다.

변경 테이블(_CT)

변경 테이블은 미러 테이블에서 만들어집니다. 여기에는 Oracle 데이터베이스에서 캡처된 변경 데이터가 포함됩니다. 테이블은 다음 규칙에 따라 이름이 지정됩니다.

[cdc].[<capture-instance>_CT]

<schema-name>.<table-name>테이블에 캡처를 처음 사용하는 경우 기본 캡처 인스턴스 이름은 <schema-name>_<table-name>입니다. 예를 들어 Oracle HR.EMPLOYEES 테이블에 대한 기본 캡처 인스턴스 이름은 HR_EMPLOYEES이고, 연결된 변경 테이블은 [cdc].[HR_EMPLOYEES_CT]입니다.

캡처 테이블은 Oracle CDC 인스턴스에서 작성됩니다. 캡처 인스턴스를 만들 때 SQL Server에서 생성된 특수 테이블 반환 함수를 사용하여 읽습니다. 예들 들어 fn_cdc_get_all_changes_HR_EMPLOYEES입니다. 이러한 CDC 함수에 대한 자세한 내용은 변경 데이터 캡처 함수(Transact-SQL)를 참조하세요.

cdc.lsn_time_mapping

[cdc].[lsn_time_mapping] 테이블은 SQL Server CDC 구성 요소에서 생성됩니다. Oracle CDC의 경우에는 일반적인 용도와 다르게 사용됩니다.

Oracle CDC의 경우 이 테이블에 저장된 LSN 값은 변경 내용과 연결된 SCN(Oracle 시스템 변경 번호) 값을 기반으로 합니다. LSN 값의 처음 6바이트는 원래 Oracle SCN 번호입니다.

또한 Oracle CDC를 사용하는 경우 time 열(tran_begin_timetran_end_time)은 일반 SQL Server CDC에와 마찬가지로 현지 시간이 아닌 변경의 UTC 시간을 저장합니다. 이렇게 하면 일광 절약 시간 변경이 lsn_time_mapping 저장된 데이터에 영향을 주지 않습니다.

cdc.xdbcdc_config

이 테이블에는 Oracle CDC 인스턴스에 대한 구성 데이터가 포함되어 있습니다. CDC Designer 콘솔을 사용하여 업데이트됩니다. 이 테이블에는 하나의 행만 있습니다.

다음 표에서는 cdc.xdbcdc_config 테이블 열을 설명합니다.

항목 설명
version CDC 인스턴스 구성의 버전을 추적합니다. 테이블이 업데이트될 때마다, 그리고 새 캡처 인스턴스가 추가되거나 기존 캡처 인스턴스가 제거될 때마다 업데이트됩니다.
connect_string Oracle 연결 문자열입니다. 기본 예제는 다음과 같습니다.

<server>:<port>/<instance> (예: erp.contoso.com:1521/orcl)

연결 문자열에서 Oracle Net 연결 설명자를 지정할 수도 있습니다(예: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp) (HOST=erp.contoso.com) (PORT=1521)) (CONNECT_DATA=(SERVICE_NAME=orcl))))

디렉터리 서버 또는 tnsnames를 사용하는 경우 연결 문자열이 연결의 이름일 수 있습니다.

Oracle 연결 문자열 대한 자세한 내용은 https://go.microsoft.com/fwlink/?LinkId=231153을 참조하세요. 여기서는 Oracle CDC Service에서 사용하는 Oracle 인스턴트 클라이언트의 Oracle 데이터베이스 연결 문자열에 대해 자세히 설명합니다.
use_windows_authentication 다음과 같은 부울 값입니다.

0: 인증을 위해 Oracle 사용자 이름 및 암호가 제공됩니다(기본값).

1: Oracle 데이터베이스에 연결하는 데 Windows 인증이 사용됩니다. Oracle 데이터베이스가 Windows 인증에서 작동하도록 구성된 경우에만 이 옵션을 사용할 수 있습니다.
사용자 이름 로그 마이닝 Oracle 데이터베이스 사용자의 이름입니다. use_windows_authentication = 0인 경우에만 필수입니다.
password 로그 마이닝 Oracle 데이터베이스 사용자의 암호입니다. use_windows_authentication = 0인 경우에만 필수입니다.
transaction_staging_timeout 커밋되지 않은 Oracle 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록되기 전에 메모리에 유지되는 시간(초)입니다. 기본값은 120초입니다.
memory_limit 데이터를 메모리에 캐시하는 데 사용할 수 있는 메모리 양(Mb)에 대한 제한입니다. 설정이 낮을수록 더 많은 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록됩니다. 기본값은 50Mb입니다.
options 이름[=값][; ] 형태의 옵션 목록이며 보조 옵션(예: 추적, 튜닝)을 지정하는 데 사용됩니다. 사용 가능한 옵션에 대한 설명은 아래 표를 참조하세요.

다음 표에서는 사용 가능한 옵션에 대해 설명합니다.

속성 기본값 Min Max 정적 설명
trace False - - False 사용 가능한 값은



False

On

off
cdc_update_state_interval 10 1 120 False 트랜잭션에 할당된 메모리 청크의 크기(KB)입니다(트랜잭션은 둘 이상의 청크를 할당할 수 있음). cdc.xdbcdc_config 테이블의 memory_limit 열을 참조하세요.
target_max_batched_transactions 100 1 1000 SQL Server CT 테이블 업데이트에서 하나의 트랜잭션으로 처리될 수 있는 Oracle 트랜잭션의 최대 수입니다.
target_idle_lsn_update_interval 10 0 1 False 캡처된 테이블에 대한 작업이 없을 때 lsn_time_mapping테이블을 업데이트하는 간격(초)입니다.
trace_retention_period 24 1 24*31 False 시간(메시지를 추적 테이블에 보관하는 시간)입니다.
sql_reconnect_interval 2 2 3600 False SQL Server에 연결하기 전에 대기하는 시간(초)입니다. 이 간격은 SQL Server 클라이언트의 연결 시간 제한과 함께 사용됩니다.
sql_reconnect_limit -1 -1 -1 False SQL Server 다시 연결의 최대 횟수입니다. -1(기본값)은 프로세스가 중지될 때까지 다시 연결을 시도한다는 것을 의미합니다.
cdc_restart_limit 6 -1 3600 False 대부분의 경우 CDC Service는 비정상적으로 종료된 CDC 인스턴스를 자동으로 다시 시작합니다. 이 속성은 인스턴스를 다시 시작하기 위해 서비스가 중지되는 오류가 발생하는 시간당 횟수를 정의합니다. -1 값은 인스턴스를 항상 다시 시작해야 한다는 것을 의미합니다.

구성 테이블이 업데이트되면 인스턴스를 다시 시작하기 서비스가 반환됩니다.
cdc_memory_report 0 0 1000 False 매개 변수 값이 변경된 경우 CDC 인스턴스에서 해당 메모리 보고서를 추적 테이블에 출력합니다.
target_command_timeout 600 1 3600 False SQL Server에서 작동하는 명령 시간 제한입니다.
source_character_set - - - Oracle 데이터베이스 코드 페이지 대신 특정 Oracle 인코딩을 사용하도록 설정할 수 있습니다. 이는 문자 데이터에서 사용하는 실제 인코딩이 Oracle 데이터베이스 코드 페이지에서 표현한 것과 다를 때 사용할 수 있습니다.
source_error_retry_interval 30 1 3600 False 연결 오류 또는 시스템 테이블 간의 일시적인 동기화 부족과 같은 여러 오류에 대해 다시 시도하기 전에 사용됩니다.
source_prefetch_size 100 1 10000 프리페치 일괄 처리의 크기입니다.
source_max_tables_in_query 100 1 10000 테이블을 필터링하지 않고 Oracle 로그 읽기로 전환하기 전에 WHERE 절에 허용되는 최대 테이블 수입니다.
source_read_retry_interval 2 1 3600 False EOF에서 Oracle 트랜잭션 로그 읽기를 다시 시도하기 전에 원본에서 대기하는 시간입니다.
source_reconnect_interval 30 1 3600 False 원본 데이터베이스에 다시 연결을 시도하기 전에 대기하는 시간(초)입니다.
source_reconnect_limit -1 -1 False 원본 데이터베이스를 다시 연결하는 최대 횟수입니다. -1(기본값)은 프로세스가 중지될 때까지 다시 연결을 시도한다는 것을 의미합니다.
source_command_timeout 30 1 3600 False Oracle에서 작동하는 연결 시간 제한입니다.
source_connection_timeout 30 1 3600 False SQL Server에서 작동하는 연결 시간 제한입니다.
trace_data_errors - - False 부울입니다. 은 데이터 변환 및 잘림 오류를 기록한다는 것을 나타냅니다.
CDC_stop_on_breaking_schema_changes False - - False 부울입니다. True 이면 주요 스키마 변경이 감지되는 경우에 중지합니다.

False 이면 미러 테이블과 캡처 인스턴스를 삭제합니다.
source_oracle_home - - False CDC 인스턴스가 Oracle에 연결하는 데 사용할 특정 Oracle 홈 경로 또는 Oracle 홈 이름으로 설정할 수 있습니다.

cdc.xdbcdc_state

이 테이블에는 Oracle CDC 인스턴스의 지속형 상태에 대한 정보가 포함됩니다. 캡처 상태는 복구 및 장애 조치(failover) 시나리오와 상태 모니터링에 사용됩니다.

다음 표에서는 cdc.xdbcdc_state 테이블 열을 설명합니다.

항목 설명
status 현재 Oracle CDC 인스턴스에 대한 현재 상태 코드입니다. 상태는 CDC의 현재 상태를 설명합니다.
sub_status 현재 상태 대한 추가 정보를 제공하는 두 번째 수준 상태입니다.
활성 다음과 같은 부울 값입니다.

0: Oracle CDC 인스턴스 프로세스가 활성 상태가 아닙니다.

1: Oracle CDC 인스턴스 프로세스가 활성 상태입니다.
error 다음과 같은 부울 값입니다.

0: Oracle CDC 인스턴스가 오류 상태가 아닙니다.

1: Oracle CDC 인스턴스가 오류 상태입니다.
status_message 오류 또는 상태에 대한 설명을 제공하는 문자열입니다.
timestamp 캡처 상태를 마지막으로 업데이트한 시간(UTC)이 포함된 타임스탬프입니다.
active_capture_node Oracle 트랜잭션 로그를 처리 중인 Oracle CDC Service 및 Oracle CDC 인스턴스를 현재 실행 중인 호스트의 이름입니다. 호스트는 클러스터 내의 노드일 수 있습니다.
last_transaction_timestamp 마지막 트랜잭션이 변경 테이블에 기록된 시간(UTC)이 포함된 타임스탬프입니다.
last_change_timestamp 원본 Oracle 트랜잭션 로그에서 가장 최근의 변경 레코드를 읽은 시간(UTC)이 포함된 타임스탬프입니다. 이 타임스탬프를 통해 CDC 프로세스의 현재 대기 시간을 식별할 수 있습니다.
transaction_log_head_cn Oracle 트랜잭션 로그에서 읽은 가장 최근의 CN(변경 번호)입니다.
transaction_log_tail_cn 다시 시작하거나 복구하는 경우 Oracle CDC 인스턴스에서 위치가 변경되는 Oracle 트랜잭션 로그의 CN(변경 번호)입니다.
current_cn 원본 데이터베이스에 있는 것으로 알려진 가장 최근의 CN(변경 번호)입니다.
software_version Oracle CDC Service의 내부 버전입니다.
completed_transactions CDC가 마지막으로 다시 설정된 이후 처리된 트랜잭션 수입니다.
written_changes SQL Server 변경 테이블에 기록된 변경 레코드 수입니다.
read_changes 원본 Oracle 트랜잭션 로그에서 읽은 변경 레코드 수입니다.
staged_transactions cdc.xdbcdc_staged_transactions 테이블에서 준비된 현재 활성 트랜잭션 수입니다.

cdc.xdbcdc_trace

이 테이블에는 CDC 인스턴스의 작업에 대한 정보가 포함됩니다. 이 테이블에 저장되는 정보에는 오류 레코드, 주목할 만한 상태 변경 및 추적 레코드가 포함됩니다. cdc.xcbcdc_trace 테이블을 사용할 수 없는 경우에도 정보를 사용할 수 있도록 오류 정보는 Windows 이벤트 로그에도 기록됩니다.

다음 표에서는 cdc.xdbcdc_trace 테이블 열을 설명합니다.

항목 설명
timestamp 추적 레코드가 기록된 정확한 UTC 타임스탬프입니다.
type 다음 값 중 하나를 포함합니다.

오류

INFO

TRACE
node 레코드가 기록된 노드의 이름입니다.
status 상태 테이블에서 사용되는 상태 코드입니다.
sub_status 상태 테이블에서 사용되는 하위 상태 코드입니다.
status_message 상태 테이블에서 사용되는 상태 메시지입니다.
데이터 오류 또는 추적 레코드에 페이로드가 포함되는 사례에 대한 추가 데이터입니다(예: 손상된 로그 레코드).

cdc.xdbcdc_staged_transactions

이 테이블에는 트랜잭션 커밋 또는 롤백 이벤트가 캡처될 때까지 대규모 또는 장기 실행 트랜잭션에 대한 변경 레코드가 저장됩니다. Oracle CDC 서비스에서 캡처된 로그 레코드를 트랜잭션 커밋 시간별로 정렬한 다음, 각 트랜잭션에 대한 시간순으로 정렬합니다. 동일한 트랜잭션에 대한 로그 레코드는 트랜잭션이 종료될 때까지 메모리에 저장되었다가 대상 변경 테이블에 기록되거나 삭제(롤백의 경우)됩니다. 사용 가능한 메모리 양이 제한되어 있으므로 트랜잭션이 완료될 때까지 대규모 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록됩니다. 트랜잭션은 오랜 시간 동안 실행되면 준비 테이블에도 기록됩니다. 따라서 Oracle CDC 인스턴스가 다시 시작되면 Oracle 트랜잭션 로그에서 이전 변경 내용을 다시 읽을 필요가 없습니다.

다음 표에서는 cdc.xdbcdc_staged_transactions 테이블 열에 대해 설명합니다.

항목 설명
transaction_id 준비 중인 트랜잭션의 고유 트랜잭션 식별자입니다.
seq_num 현재 트랜잭션의 xcbcdc_staged_transactions 행 수입니다(0부터 시작).
data_start_cn 이 행에 있는 데이터의 첫 번째 변경 내용에 대한 CN(변경 번호)입니다.
data_end_cn 이 행에 있는 데이터의 마지막 변경 내용에 대한 CN(변경 번호)입니다.
데이터 BLOB 형식의 트랜잭션에 대한 스테이징된 변경 내용입니다.

참고 항목

Attunity Oracle CDC Designer