文中内容仅限技术学习与代码实践参考,市场存在不确定性,技术分析需谨慎验证,不构成任何投资建议。

Apache Atlas
Apache Atlas 框架是一套可扩展的核心基础治理服务,使企业能够有效、高效地满足 Hadoop 中的合规性要求,并支持与整个企业数据生态系统集成。这将通过使用规范和取证模型,以及技术和运营审计以及由业务分类元数据丰富的沿袭,在 Hadoop 中提供真正的可视性。它还使任何元数据使用者能够互操作,而无需彼此独立的接口——元数据存储是通用的。通过利用 Apache Ranger 来维护元数据的准确性,以防止在运行时对数据进行未经授权的访问。安全性基于角色 (RBAC) 和属性 (ABAC)。

基本搜索

Basic Search

基本搜索允许你使用实体的 typename、关联的 classification/tag 进行查询,并支持对实体属性以及 classification/tag 属性进行过滤。

整个查询结构可以用以下 JSON 结构(称为 SearchParameters)表示

{"typeName":               "hive_column","excludeDeletedEntities": true,"classification":         "PII","query":                  "","offset":                 0,"limit":                  25,"entityFilters":          {  },"tagFilters":             { },"attributes":             [ "table", "qualifiedName"]
}

字段说明

typeName:               要查找的实体类型
excludeDeletedEntities: 搜索是否应排除已删除的实体?(默认值:true)
classification:         仅包含具有给定 classification 的实体
query:                  实体应包含的任意自由文本(通用/通配符查询可能较慢)
offset:                 结果集的起始偏移量(用于分页)
limit:                  要获取的最大结果数
entityFilters:          实体属性过滤条件
tagFilters:             classification 属性过滤条件
attributes:             要在搜索结果中包含的属性

图片

属性过滤支持对多个属性进行 AND/OR 条件组合。

过滤示例(针对 hive_table 属性)

  • 单属性
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"attributeName":  "name","operator":       "contains","attributeValue": "customers"},"attributes": [ "db", "qualifiedName" ]}

图片

  • 多属性 OR
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"condition": "OR","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "name","operator":       "contains","attributeValue": "provider"}]},"attributes": [ "db", "qualifiedName" ]}

图片

  • 多属性 AND
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"condition": "AND","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "owner","operator":       "eq","attributeValue": "hive"}]},"attributes": [ "db", "qualifiedName" ]}

图片

支持的过滤运算符

  • LT(符号:<, lt)适用于数值、日期属性
  • GT(符号:>, gt)适用于数值、日期属性
  • LTE(符号:<=, lte)适用于数值、日期属性
  • GTE(符号:>=, gte)适用于数值、日期属性
  • EQ(符号:eq, =)适用于数值、日期、字符串属性
  • NEQ(符号:neq, !=)适用于数值、日期、字符串属性
  • LIKE(符号:like, LIKE)适用于字符串属性
  • STARTS_WITH(符号:startsWith, STARTSWITH)适用于字符串属性
  • ENDS_WITH(符号:endsWith, ENDSWITH)适用于字符串属性
  • CONTAINS(符号:contains, CONTAINS)适用于字符串属性

CURL 示例

curl -sivk -g-u <user>:<password>-X POST-d '{"typeName":               "hive_table","excludeDeletedEntities": true,"classification":         "","query":                  "","offset":                 0,"limit":                  50,"entityFilters": {"condition": "AND","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "owner","operator":       "eq","attributeValue": "hive"}]},"attributes": [ "db", "qualifiedName" ]}'<protocol>://<atlas_host>:<atlas_port>/api/atlas/v2/search/basic

Apache Atlas 概览

Apache Atlas 是一套可扩展且可延伸的核心基础治理服务——使企业能够在 Hadoop 中高效且有效地满足其合规要求,并允许与整个企业数据生态系统进行集成。

Apache Atlas 为组织提供开放的元数据管理和治理能力,用于构建其数据资产目录,对这些资产进行分类和治理,并为数据科学家、分析师和数据治理团队提供围绕这些数据资产的协作能力。

特性

元数据类型与实例

  • 为各种 Hadoop 和非 Hadoop 元数据预定义类型
  • 具备为待管理元数据定义新类型的能力
  • 类型可包含原始属性、复杂属性、对象引用;可从其他类型继承
  • 类型的实例(称为实体)捕获元数据对象详情及其关系
  • 提供 REST API 以便更轻松地与类型和实例进行集成

分类

  • 具备动态创建分类的能力——例如 PII、EXPIRES_ON、DATA_QUALITY、SENSITIVE
  • 分类可包含属性——例如在 EXPIRES_ON 分类中的 expiry_date 属性
  • 实体可与多个分类关联,便于发现和安全策略执行
  • 通过血缘关系传播分类——自动确保分类随数据在各种处理过程中流转

血缘

  • 直观的 UI 查看数据在各类流程中的血缘
  • 提供 REST API 以访问和更新血缘信息

搜索/发现

  • 直观的 UI 按类型、分类、属性值或自由文本搜索实体
  • 丰富的 REST API 以复杂条件进行搜索
  • SQL 风格的实体查询语言——领域特定语言(DSL)

安全与数据脱敏

  • 针对元数据访问的细粒度安全控制,可对实体实例及添加/更新/移除分类等操作进行权限管控
  • 与 Apache Ranger 集成,可根据 Apache Atlas 中实体关联的分类进行基于授权的访问控制/数据脱敏。例如:
    • 谁能访问被分类为 PII、SENSITIVE 的数据
    • 客户服务用户仅能看到被分类为 NATIONAL_ID 的列的最后四位

快速开始

  • Apache Atlas 2.4 的新功能
  • 构建与安装
  • 快速入门

API 文档

  • REST API 文档
  • 导出与导入 REST API 文档
  • 旧版 API 文档

开发者设置文档

  • 开发者设置:Eclipse

风险提示与免责声明
本文内容基于公开信息研究整理,不构成任何形式的投资建议。历史表现不应作为未来收益保证,市场存在不可预见的波动风险。投资者需结合自身财务状况及风险承受能力独立决策,并自行承担交易结果。作者及发布方不对任何依据本文操作导致的损失承担法律责任。市场有风险,投资须谨慎。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/95395.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/95395.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/95395.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LangChain4J-(1)-Hello World

一、LangChain4J是什么&#xff1f; LangChain4J 是一个专为 Java 生态系统设计的开源框架&#xff0c;用于简化与大语言模型&#xff08;LLM&#xff0c;如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 等&#xff09;的集成和交互。它借鉴了 Python 生态中 L…

HTTPS应用层协议-中间攻击人

HTTPS应用层协议-中间攻击人 • Man-in-the-MiddleAttack&#xff0c;简称“MITM 攻击” 确实&#xff0c;在方案 2/3/4 中&#xff0c;客户端获取到公钥 S 之后&#xff0c;对客户端形成的对称秘钥 X 用服务端给客户端的公钥 S 进行加密&#xff0c;中间人即使窃取到了数据&am…

利用 Makefile 高效启动 VIVADO 软件:深入解析与实践

利用 Makefile 高效启动 VIVADO 软件&#xff1a;深入解析与实践 系列文章目录 1、VMware Workstation Pro安装指南&#xff1a;详细步骤与配置选项说明 2、VMware 下 Ubuntu 操作系统下载与安装指南 3.基于 Ubuntu 的 Linux 系统中 Vivado 2020.1 下载安装教程 文章目录利用 …

[前端算法]排序算法

默认情况下&#xff0c;sort() 会将元素转换为字符串&#xff0c;然后按照 Unicode 编码的顺序进行排序&#xff1a; const fruits [apple, banana, cherry, date]; fruits.sort(); console.log(fruits); // 输出: ["apple", "banana", "cherry"…

C#标签批量打印程序开发

C#标签批量打印程序开发&#xff08;集成Bartender解决方案&#xff09;一、系统架构设计 1. 核心模块划分 public class LabelPrintingSystem {private IDataLoader _dataLoader; // 数据加载器private ITemplateEngine _templateEngine; // 模板引擎private IPrintControl…

ECC的原理、背景、工作机制和数学基础

ECC的原理、背景、工作机制和数学基础摘要&#xff1a;本文首先详细介绍ECC&#xff08;Error-Correcting Code&#xff0c;纠错码&#xff09;的原理&#xff0c;包括背景、工作机制和数学基础。然后&#xff0c;解释ECC在SRAM&#xff08;Static Random-Access Memory&#x…

计算机网络2-2:物理层下面的传输媒体

目录 导引型传输媒体 同轴电缆 双绞线 光纤 电力线 非导引型传输媒体 无线电波 微波 红外线 可见光 无线电频谱管理机构 导引型传输媒体 同轴电缆 双绞线 光纤 光在光纤中传播的基本原理 电力线 非导引型传输媒体 无线电波 微波 红外线 可见光 LiFi(可见光通信) …

Dify 从入门到精通(第 32/100 篇):Dify 的日志分析与监控

Dify 从入门到精通&#xff08;第 32/100 篇&#xff09;&#xff1a;Dify 的日志分析与监控 Dify 入门到精通系列文章目录 第一篇《Dify 究竟是什么&#xff1f;真能开启低代码 AI 应用开发的未来&#xff1f;》介绍了 Dify 的定位与优势第二篇《Dify 的核心组件&#xff1a…

【IntelliJ IDEA】修改堆内存

idea卡顿&#xff0c;鼠标漂移修改idea文件打开 idea 安装路径&#xff0c;【bin】目录下【idea64.exe.vmoptions】文件修改【-Xms】最小内存【-Xmx】最大内存-Xms2048m -Xmx9216midea更改内存设置工具栏帮助更改内存设置设置堆大小上限为 文件 设置的最大内存保存并重启Leslie…

Docker与Docker Compose:容器世界的“单兵作战”与“军团指挥官”

在容器化技术的浪潮中&#xff0c;Docker和Docker Compose如同“双子星”&#xff0c;一个专注于单兵作战&#xff0c;一个擅长军团指挥。它们看似相似&#xff0c;却各司其职。对于开发者来说&#xff0c;理解它们的区别不仅能让代码部署事半功倍&#xff0c;更能避免踩坑。本…

进阶向:Python编写自动化邮件发送程序

Python编写自动化邮件发送程序&#xff1a;从零开始详解在数字化时代&#xff0c;自动化邮件发送功能已成为企业和个人提升工作效率的重要工具。据统计&#xff0c;全球每天发送的商业邮件超过30亿封&#xff0c;其中约40%是通过自动化系统发送的。这种功能被广泛应用于多种场景…

ChatGpt 5系列文章1——编码与智能体

人工智能技术正在以惊人的速度发展&#xff0c;重新定义着开发人员的工作方式。2025年8月&#xff0c;OpenAI正式发布了面向开发人员的GPT-5 一、GPT-5的编码能力突破 GPT-5在关键编码基准测试中创造了行业新纪录(SOTA)&#xff0c;在SWE-bench Verified测试中得分74.9%&…

力扣top100(day02-05)--二叉树 02

102. 二叉树的层序遍历 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right)…

开疆智能Ethernet转ModbusTCP网关连接发那科机器人与三菱PLC配置案例

本案例是三菱FX5U PLC通过ethernet/IP转ModbusTCP网关对发那科机器人进行控制的配置案例。PLC端主要配置以太网端口设置在通信测试中&#xff0c;PLC作为主站&#xff0c;在PLC设置中选择“以太网端口”非常关键&#xff0c;以确保通信测试的正常进行。1、首先&#xff0c;在PL…

VUE+SPRINGBOOT从0-1打造前后端-前后台系统-系统首页

在现代Web应用开发中&#xff0c;管理后台是几乎所有企业级应用不可或缺的部分。一个优秀的后台首页不仅需要提供清晰的信息展示&#xff0c;还需要具备良好的用户体验和视觉效果。本文将详细介绍如何使用Vue.js框架配合Element UI组件库和ECharts图表库&#xff0c;构建一个功…

第6节 torch.nn介绍

6.1 torch.nn.Module介绍 torch.nn.Module是 PyTorch 中构建神经网络的基础类&#xff0c;所有的神经网络模块都应该继承这个类。它提供了一种便捷的方式来组织和管理网络中的各个组件&#xff0c;包括层、参数等&#xff0c;同时还内置了许多用于模型训练和推理的功能。 官网…

python自学笔记7 可视化初步

图像的组成工具库 Matplotlib&#xff1a;绘制静态图 Plotly: 可以绘制交互式图片 图像的绘制&#xff08;Matplotlib&#xff09; 创建图形&#xff0c;轴对象 创造等差数列 # 包含后端点 arr np.linspace(0, 1, num11) # 不包含后端点 arr_no_endpoint np.linspace(0, 1, n…

GIS 常用的矢量与栅格分析工具

矢量处理工具作用典型应用缓冲区分析Buffer环境影响区域&#xff0c;空间邻近度分析等&#xff0c;例如道路周围一公里内的学校&#xff0c;噪音污染影响的范围裁剪Clip例如使用A市图层裁剪全国道路数据&#xff0c;获取A市道路数据交集Intersect识别与LUCC、分区洪水区、基础设…

http与https协议区别;vue3本地连接https地址接口报500

文章目录问题解决方案一、问题原因分析二、解决方案详解1. 保持当前配置&#xff08;推荐临时方案&#xff09;2. 更安全的方案&#xff08;推荐&#xff09;3. 环境区分配置&#xff08;最佳实践&#xff09;三、为什么开发环境不用配置&#xff1f;问题 问题&#xff1a;本地…

C语言——深入理解指针(三)

C语言——深入理解指针&#xff08;三&#xff09; 1.回调函数是什么&#xff1f; 首先我们来回顾一下函数的直接调用&#xff1a;而回调函数就是通过函数指针调用的函数。我们将函数的指针&#xff08;地址&#xff09;作为参数传递给另一个函数&#xff0c;当这个指针被用来调…