一、Oracle 数据库核心配置详解
1. 启用归档日志(Archiving Log)

Oracle CDC 依赖归档日志获取增量变更数据,需按以下步骤启用:

非CDB数据库配置:

-- 以DBA身份连接数据库  
CONNECT sys/password AS SYSDBA;  -- 配置归档目标路径和大小  
ALTER SYSTEM SET db_recovery_file_dest_size = 10G;  
ALTER SYSTEM SET db_recovery_file_dest = '/opt/oracle/oradata/recovery_area' SCOPE=SPFILE;  -- 重启数据库并启用归档模式  
SHUTDOWN IMMEDIATE;  
STARTUP MOUNT;  
ALTER DATABASE ARCHIVELOG;  
ALTER DATABASE OPEN;  -- 检查归档模式是否启用  
ARCHIVE LOG LIST;  
-- 输出应显示:Database log mode: Archive Mode  

CDB数据库配置(多租户架构):

-- 连接CDB根容器  
CONNECT sys/password@//localhost:1521/ORCLCDB AS SYSDBA;  -- 配置归档路径(与非CDB类似)  
ALTER SYSTEM SET db_recovery_file_dest_size = 10G;  
ALTER SYSTEM SET db_recovery_file_dest = '/opt/oracle/oradata/recovery_area' SCOPE=SPFILE;  
SHUTDOWN IMMEDIATE;  
STARTUP MOUNT;  
ALTER DATABASE ARCHIVELOG;  
ALTER DATABASE OPEN;  -- 进入PDB容器(如ORCLPDB1)  
ALTER SESSION SET CONTAINER = ORCLPDB1;  
2. 启用补充日志(Supplemental Logging)

补充日志用于捕获数据变更的前后状态,需为目标表或数据库启用:

-- 为指定表启用补充日志(捕获所有列变更)  
ALTER TABLE inventory.customers ADD SUPPLEMENTAL LOG DATA (ALL) COLUMNS;  -- 为整个数据库启用补充日志  
ALTER DATABASE ADD SUPPLEMENTAL LOG DATA;  
3. 创建专用用户并授权
-- 创建表空间(非CDB)  
CREATE TABLESPACE logminer_tbs DATAFILE '/opt/oracle/oradata/SID/logminer_tbs.dbf' 
SIZE 25M REUSE AUTOEXTEND ON MAXSIZE UNLIMITED;  -- 创建用户并授予基础权限(非CDB)  
CREATE USER flinkuser IDENTIFIED BY flinkpw 
DEFAULT TABLESPACE logminer_tbs QUOTA UNLIMITED ON logminer_tbs;  
GRANT CREATE SESSION, SET CONTAINER, SELECT ON V_$DATABASE TO flinkuser;  
GRANT FLASHBACK ANY TABLE, SELECT ANY TABLE TO flinkuser;  
GRANT SELECT_CATALOG_ROLE, EXECUTE_CATALOG_ROLE TO flinkuser;  
GRANT SELECT ANY TRANSACTION, LOGMINING, ANALYZE ANY TO flinkuser;  -- 授予LogMiner相关权限  
GRANT EXECUTE ON DBMS_LOGMNR TO flinkuser;  
GRANT EXECUTE ON DBMS_LOGMNR_D TO flinkuser;  -- 授予视图查询权限(关键:读取日志元数据)  
GRANT SELECT ON V_$LOG, V_$LOG_HISTORY TO flinkuser;  
GRANT SELECT ON V_$LOGMNR_LOGS, V_$LOGMNR_CONTENTS TO flinkuser;  
GRANT SELECT ON V_$LOGMNR_PARAMETERS, V_$LOGFILE TO flinkuser;  
GRANT SELECT ON V_$ARCHIVED_LOG, V_$ARCHIVE_DEST_STATUS TO flinkuser;  

CDB数据库特殊配置:

-- 在CDB中创建用户时指定CONTAINER=ALL  
CREATE USER flinkuser IDENTIFIED BY flinkpw 
DEFAULT TABLESPACE logminer_tbs QUOTA UNLIMITED ON logminer_tbs CONTAINER=ALL;  
GRANT CREATE SESSION, SET CONTAINER TO flinkuser CONTAINER=ALL;  
-- 其他权限同理添加CONTAINER=ALL后缀(如GRANT SELECT ANY TABLE TO flinkuser CONTAINER=ALL)  
二、Flink 环境集成配置
1. 添加Maven依赖(项目开发)
<dependency><groupId>com.ververica</groupId><artifactId>flink-sql-connector-oracle-cdc</artifactId><version>3.0.1</version><scope>provided</scope>
</dependency>
2. SQL Client部署(非Maven环境)
  1. 下载连接器JAR包:flink-sql-connector-oracle-cdc-3.0.1.jar
  2. 将JAR包放入$FLINK_HOME/lib/目录
  3. 重启Flink集群使依赖生效
三、Flink SQL 表定义与参数详解
1. 完整建表示例(含元数据列)
-- 设置checkpoint间隔(可选)  
SET 'execution.checkpointing.interval' = '5s';  -- 创建Oracle CDC表(含元数据列)  
CREATE TABLE oracle_products (id INT,name STRING,description STRING,weight DECIMAL(10, 3),-- 元数据列:捕获数据库变更信息  db_name STRING METADATA FROM 'database_name' VIRTUAL,schema_name STRING METADATA FROM 'schema_name' VIRTUAL,table_name STRING METADATA FROM 'table_name' VIRTUAL,op_ts TIMESTAMP_LTZ(3) METADATA FROM 'op_ts' VIRTUAL,PRIMARY KEY(id) NOT ENFORCED
) WITH ('connector' = 'oracle-cdc','hostname' = '192.168.1.100','port' = '1521','username' = 'flinkuser','password' = 'flinkpw','database-name' = 'ORCLCDB','schema-name' = 'inventory','table-name' = 'products',-- 关键参数详解  'debezium.log.mining.strategy' = 'online_catalog','debezium.log.mining.continuous.mine' = 'true','scan.startup.mode' = 'initial','scan.incremental.snapshot.enabled' = 'true'
);
2. 核心参数详解
参数名必选默认值类型说明
connectorString固定为oracle-cdc
hostnameStringOracle服务器IP(若配置url,则可不填)
usernameString连接Oracle的用户名(需具备前文授权的权限)
passwordString连接Oracle的密码
database-nameString数据库名(如ORCLCDB
schema-nameString模式名(如inventory
table-nameString表名(如products
port1521Integer数据库端口号
url自动拼接StringJDBC连接串(优先级高于hostname+port),格式:jdbc:oracle:thin:@host:port/database
scan.startup.modeinitialString启动模式:initial(快照+redo日志)、latest-offset(仅最新变更)
scan.incremental.snapshot.enabledtrueBoolean启用增量快照(并行读取,无需锁),建议保持默认
debezium.log.mining.strategyonline_catalogString日志挖掘策略:online_catalog(在线目录)、file_based(基于文件)
debezium.log.mining.continuous.minetrueBoolean持续挖掘日志(保持增量读取)
四、环境验证与测试流程
1. 准备测试数据(Oracle)
-- 创建测试表(假设已在inventory模式下)  
CREATE TABLE inventory.products (id INT PRIMARY KEY,name VARCHAR2(100),price NUMBER(10, 2),stock INT,update_time TIMESTAMP
);-- 插入测试数据  
INSERT INTO inventory.products VALUES (1, '笔记本电脑', 5999.00, 100, SYSDATE);  
INSERT INTO inventory.products VALUES (2, '智能手机', 3999.00, 200, SYSDATE);  
COMMIT;
2. 使用Flink SQL验证数据同步
-- 查询Oracle CDC表(首次查询触发快照读取)  
SELECT * FROM oracle_products;  -- 观察输出:应显示插入的两条记录  
-- 后续在Oracle中更新数据,Flink会实时捕获变更  
UPDATE inventory.products SET price = 6499.00 WHERE id = 1;  
COMMIT;
3. DataStream API 验证示例(并行模式)
import org.apache.flink.cdc.connectors.oracle.source.OracleSourceBuilder;
import org.apache.flink.cdc.debezium.JsonDebeziumDeserializationSchema;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;public class OracleCdcParallelExample {public static void main(String[] args) throws Exception {// 配置Oracle Source(并行增量快照模式)OracleSourceBuilder<String> sourceBuilder = OracleSourceBuilder.<String>builder().hostname("192.168.1.100").port(1521).database("ORCLCDB").schemaList("inventory").tableList("inventory.products").username("flinkuser").password("flinkpw").deserializer(new JsonDebeziumDeserializationSchema()).startupOptions(StartupOptions.initial()).splitSize(1000) // 快照分片大小.debeziumProperty("log.mining.strategy", "online_catalog");StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.enableCheckpointing(5000); // 5秒checkpointenv.fromSource(sourceBuilder.build(),WatermarkStrategy.noWatermarks(),"Oracle CDC Source").setParallelism(4) // 设置4并行度读取.print();env.execute("Oracle CDC Test");}
}
五、常见问题与解决方案
  1. 归档日志未启用错误

    ERROR: ORA-01232: archived log is disabled
    
    • 解决方案:确认已执行ALTER DATABASE ARCHIVELOG,并重启数据库使配置生效。
  2. 权限不足错误

    ERROR: ORA-01031: insufficient privileges
    
    • 解决方案:检查用户是否具备LOGMININGSELECT ANY TRANSACTION等关键权限,重新执行授权语句。
  3. 增量快照失败(无主键表)

    ERROR: Table has no primary key, cannot split snapshot chunks
    
    • 解决方案:为表添加主键,或手动指定分片键:
      'scan.incremental.snapshot.chunk.key-column' = 'id'  -- 替换为实际列名
      
  4. CDB/PDB连接失败

    • 解决方案:在Flink DDL中添加PDB名称:
      'debezium.database.pdb.name' = 'ORCLPDB1'  -- 替换为实际PDB名
      
  5. 快照阶段Checkpoint超时

    • 解决方案:调整Flink配置以避免大表快照时Checkpoint失败:
      SET 'execution.checkpointing.interval' = '10min';
      SET 'execution.checkpointing.tolerable-failed-checkpoints' = '100';
      
六、生产环境优化建议
  1. 归档日志清理策略

    • 配置自动删除过期归档日志:
      -- 创建归档日志删除策略(保留7天)  
      EXEC DBMS_BACKUP_RESTORE.DELETEARCHIVELOG('OLDER THAN 7 DAYS', 'DELETE'
      );
      
  2. 连接池优化

    • 在Flink DDL中调整连接池大小:
      'connection.pool.size' = '30'  -- 根据并发需求调整
      
  3. 性能监控

    • 监控Oracle视图V$LOGMNR_CONTENTS确认日志挖掘状态,或通过Flink Web UI观察任务并行度与吞吐量。

通过以上步骤,可完成Flink Oracle CDC的全流程配置与验证。生产环境中需特别注意归档日志空间管理、CDB/PDB架构适配及大表快照的并行参数调优,以确保数据一致性和系统稳定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913484.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913484.shtml
英文地址,请注明出处:http://en.pswp.cn/news/913484.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ssh: Could not resolve hostname d: Temporary failure in name resolution

关于不能本机上传文件夹到服务器上的一个问题的记录。 scp -r "D:\***\datasets" usernamexxxxxx:接收文件夹名 一直报错&#xff1a;ssh: Could not resolve hostname d: Temporary failure in name resolution 反复尝试发现无果之后想起来&#xff0c;在传输的时候…

2025年的前后端一体化CMS框架优选方案

以下是结合技术生态、开发效率和商业落地验证&#xff0c;整理的2025年前后端一体化CMS框架优选方案&#xff1a;一、‌主流成熟框架组合‌1. ‌React Node.js (Express/Next.js)‌‌前端‌&#xff1a;React生态成熟&#xff0c;配合Redux状态管理&#xff0c;适合复杂后台界…

《声音的变形记:Web Audio API的实时特效法则》

用户期待更丰富、更具沉浸感的听觉体验时&#xff0c;基于Web Audio API实现的实时音频特效&#xff0c;就像是为这片森林注入了灵动的精灵&#xff0c;让简单的声音蜕变为震撼人心的听觉盛宴。回声特效带来空间的深邃回响&#xff0c;变声效果赋予声音全新的个性面貌。接下来&…

LLM场景下的强化学习【PPO】

适合本身对强化学习有基本了解 一、什么是强化学习 一句话&#xff1a;在当前状态(State)下&#xff0c;智能体(Agent)与环境(Environment)交互&#xff0c;并采取动作(Action)进入下一状态&#xff0c;过程中获得奖励(Reward&#xff0c;有正向有负向)&#xff0c;从而实现从…

Python爬虫实战:研究chardet库相关技术

1. 引言 1.1 研究背景与意义 在互联网信息爆炸的时代,网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python 作为一种高效的编程语言,凭借其丰富的第三方库和简洁的语法,成为爬虫开发的首选语言之一。然而,在网络数据采集中,文本编码的多样性和不确定…

回溯题解——全排列【LeetCode】

46. 全排列 一、算法逻辑&#xff08;逐步通顺讲解每一步思路&#xff09; 该算法使用了典型的 回溯&#xff08;backtracking&#xff09; 状态数组 思路&#xff0c;逐层递归生成排列。 题目目标&#xff1a;给定一个无重复整数数组 nums&#xff0c;返回其所有可能的全排…

RICE模型或KANO模型在具体UI评审时的运用经验

模型是抽象的产物,结合场景才好说明(数据为非精确实际数据,仅供参考,勿照搬)。 ​​案例一:RICE模型解决「支付流程优化」vs「首页动效升级」优先级争议​​ ​​背景​​:APP电商模块在迭代中面临两个需求冲突——支付团队主张优化支付失败提示(减少用户流失),设计…

缓存中间件

缓存与分布式锁 即时性、数据一致要求不高的 访问量大且更新频率不高的数据 &#xff08;读多&#xff0c;写少&#xff09; 常用缓存中间件 redis Spring 如果用spring的情况下&#xff0c;由于redis没有受spring的管理&#xff0c; 则我们需要自己先写一个redis的配置类&…

大语言模型全方位解析:从基础认知到RESTful API应用

文章目录 前言一、初见大模型1.1 大语言模型基本知识了解&#xff08;一&#xff09;日常可能用到的大语言模型&#xff08;二&#xff09;大模型的作用&#xff08;三&#xff09;核心价值 1.2 大模型与人工智能关系1.3 大语言模型的“前世今生”与发展1.3.1 大语言模型的发展…

网安系列【11】之目录穿越与文件包含漏洞详解

文章目录 前言一 目录穿越漏洞1.1 什么是目录穿越&#xff1f;1.2 目录穿越的原理1.3 目录穿越的常见形式1.3.1 基本形式1.3.2 编码绕过1.3.3 绝对路径攻击 1.4 实战案例解析1.4.1 案例1&#xff1a;简单的目录穿越1.4.2 案例2&#xff1a;编码绕过 1.5 目录穿越的危害 二、文件…

uri-url-HttpServletRequest

1. 使用HttpServletRequest UrlPathHelper 解析 出 url路径 org.springframework.web.util.UrlPathHelper 是 Spring 框架中用于处理 HTTP 请求路径的一个工具类&#xff0c;它帮助解析和处理与请求路径相关的细节。特别是 getLookupPathForRequest(HttpServletRequest request…

Ubuntu22.04安装p4显卡 nvidia-utils-570-server 570.133.20驱动CUDA Version: 12.8

Ubuntu22.04安装p4显卡 nvidia-utils-570-server 570.133.20驱动CUDA Version: 12.8专业显卡就是专业显卡&#xff0c;尽管p4已经掉到了白菜价&#xff0c;官方的支持却一直都保持&#xff0c;比如它可以装上cuda12.8,这真的出乎我意料。NVIDIA Tesla P4显卡的主要情况Pascal架…

工业日志AI大模型智能分析系统-前端实现

目录 主要架构 前端项目结构 1. 核心实现代码 1.1 API服务封装 (src/api/log.ts) 1.2 TS类型定义 (src/types/api.ts) 1.3 Pinia状态管理 (src/stores/logStore.ts) 1.4 日志分析页面 (src/views/LogAnalysis.vue) 1.5 日志详情组件 (src/components/LogDetail.vue) 2…

C++内存泄漏排查

引言 C内存泄漏问题的普遍性与危害内存泄漏排查大赛的背景与目标文章结构和主要内容概述 内存泄漏的基本概念 内存泄漏的定义与类型&#xff08;显式、隐式、循环引用等&#xff09;C中常见的内存泄漏场景&#xff08;指针管理不当、资源未释放等&#xff09;内存泄漏对程序性能…

20250706-4-Docker 快速入门(上)-常用容器管理命令_笔记

一、常用管理命令1. 选项&#xfeff;&#xfeff;1&#xff09;ls&#xfeff;功能&#xff1a;列出容器常用参数&#xff1a;-a&#xff1a;查看所有容器包含退出的-q&#xff1a;列出所有容器ID-l&#xff1a;列出最新创建的容器状态使用技巧&#xff1a;容器很多时使用dock…

基于 Camunda BPM 的工作流引擎示例项目

项目介绍 这是一个基于 Camunda BPM 的工作流引擎示例项目&#xff0c;包含完整的后台接口和前端页面&#xff0c;实现了流程的设计、部署、执行等核心功能。 技术栈 后端 Spring Boot 2.7.9Camunda BPM 7.18.0MySQL 8.0JDK 1.8 前端 Vue 3Element PlusBpmn.jsVite 功能…

Day06_刷题niuke20250707

试卷01&#xff1a; 单选题 C 1. 在C中,一个程序无论由多少个源程序文件组成,其中有且仅有一个主函数main().说法是否正确&#xff1f; A 正确 B 错误 正确答案&#xff1a;A 官方解析&#xff1a; 在C程序设计中,一个完整的程序确实有且仅有一个main函数作为程序的入口点,这…

洛谷 P5788 【模板】单调栈

题目背景模板题&#xff0c;无背景。2019.12.12 更新数据&#xff0c;放宽时限&#xff0c;现在不再卡常了。题目描述给出项数为 n 的整数数列 a1…n​。定义函数 f(i) 代表数列中第 i 个元素之后第一个大于 ai​ 的元素的下标&#xff0c;即 f(i)mini<j≤n,aj​>ai​​{…

linux系统运行时_安全的_备份_还原_方法rsync

1.问题与需求 问题: 新部署的机器设备(主控RK3588), 没有经过烧录定制镜像, 研发部署, 直接组装发送到客户现场需要通过frpc远程部署: 安装ros2 python包 docker镜像 环境配置 自启动配置 SN设备信息写自动部署脚本, 实现一键部署升级无奈物联网卡做了白名单限制, apt 和…

18套精美族谱Excel模板,助力家族文化传承!

【资源分享】18套精美族谱Excel模板&#xff0c;助力家族文化传承&#xff01; &#x1f3af; 本文分享一套完整的家族谱系资源&#xff0c;包含18个精心设计的Excel模板&#xff0c;从基础模板到专业图表&#xff0c;满足各类家族的族谱制作需求。 一、为什么要制作族谱&…