博文、解决方案和视频

我们会不时发布与敏感数据保护相关的论文、博文和视频。本文已列出这些内容。

博文

利用敏感数据保护功能保护生成式 AI 工作负载

本博文探索了一种以数据为中心的方法,通过敏感数据保护来保护生成式 AI 应用,并提供了一个包含真实示例的 Jupyter 笔记本。

阅读博文:“敏感数据保护如何帮助保护生成式 AI 工作负载”

使用 DLP 自动管理 BigQuery 的数据风险

敏感数据发现服务会持续扫描整个组织中的数据,让您大致了解自己拥有哪些数据,并确切了解敏感数据的存储和处理位置。这种意识是保护和治理数据的关键第一步,也是帮助改善安全性、隐私权和合规性状况的关键控制措施。

阅读博文:“使用 DLP 自动管理 BigQuery 的数据风险”

不仅仅是合规:为当今以云为中心的世界重新构想 DLP 机制

请回顾 DLP 的历史记录,然后再讨论 DLP 在当今环境中的意义,包括合规性、安全性和隐私权用例。

阅读博文:“为当今以云为中心的世界重新构想 DLP 机制”

只需点几下鼠标即可扫描敏感数据

深入了解敏感数据保护的 Google Cloud 控制台界面,说明如何通过点击几下,开始检查企业数据。

阅读博文:“掌管数据:只需点几下鼠标即可扫描敏感数据”

令牌化处理如何在不牺牲隐私的情况下让数据可用

令牌化(有时称为“假名化”(pseudonymization) 或“代理替换”(surrogate replacement))广泛用于金融和医疗保健等行业,有助于降低使用中的数据的风险、缩小合规工作范围,并最大程度地避免敏感数据暴露给无关的系统。借助敏感数据保护,客户只需极少的设置即可大规模执行令牌化处理。

阅读博文:“掌管数据:令牌化处理如何在不牺牲隐私的情况下让数据可用”

使用敏感数据保护功能对敏感信息进行去标识化和混淆处理

该团队讨论了如何利用敏感数据保护功能,通过自动将数据混淆技术和数据最小化技术整合到您的工作流中来保护数据。

阅读博文:“掌管数据:使用敏感数据保护对敏感信息进行去标识化和混淆处理”

使用敏感数据保护功能来查找和保护个人身份信息

敏感数据保护产品经理 Scott Ellis 讨论了如何利用敏感数据保护来改善隐私状况。

阅读博文:“掌管数据:使用 Cloud DLP 查找并保护个人身份信息 (PII)”

使用敏感数据保护扫描 BigQuery

该团队分享了如何从 Google Cloud 控制台轻松扫描 BigQuery。

阅读博文:“使用敏感数据保护扫描 BigQuery 中的敏感数据”

解决方案

使用 JDBC 对 SQL 数据库进行敏感数据保护混合检查

本教程介绍如何将敏感数据保护混合检查方法与 JDBC 驱动程序结合使用,以检查在几乎任何位置运行的 SQL 数据库(如 MySQL、SQL Server 或 PostgreSQL)中的表样本。

阅读教程:“使用 JDBC 对 SQL 数据库进行敏感数据保护混合检查”

使用敏感数据保护的语音隐去框架

本教程包含一组组件和代码,可用于隐去音频文件中的敏感信息。使用上传到 Cloud Storage 的文件,可以发现和写入敏感发现结果,也可以隐去音频文件中的敏感信息。

另外第二个教程是 Speech Analysis Framework 包含一系列组件和代码,可用于转录音频、创建数据流水线以分析转录的音频文件,以及通过敏感数据保护功能隐去音频转录内容中的敏感信息。

GitHub:“Speech Redaction Framework”

GitHub:“Speech Analysis Framework”

采用敏感数据保护的事件驱动型无服务器调度架构

本教程展示了使用 Google Cloud 服务的简单而有效且可伸缩的事件驱动型无服务器调度架构。所包含的示例演示了如何使用 DLP API 检查 BigQuery 数据。

阅读教程:“具有敏感数据保护的事件驱动型无服务器调度架构”

适用于 Envoy 的敏感数据保护过滤器

适用于 Envoy 的敏感数据保护过滤器是适用于 Istio 服务网格内的 Envoy Sidecar 代理的 WebAssembly(“Wasm”)HTTP 过滤器。适用于 Envoy 的敏感数据保护过滤器会捕获代理数据平面流量,并将其发送到敏感数据保护进行检查,其中会扫描载荷中是否存在敏感数据(包括个人身份信息)。

GitHub:适用于 Envoy 的敏感数据保护过滤器

使用流式分析和 AI 进行异常检测

在本文中,我们将介绍一种用于检测日志文件中的异常情况的实时 AI 模式。通过分析和提取网络日志中的功能,帮助电信 (telco) 客户构建流式分析流水线以检测异常情况。此外,我们还将讨论如何调整此模式来满足组织的实时需求。此概念验证解决方案使用 Pub/Sub、Dataflow、BigQuery ML 和敏感数据保护。

阅读博文:“使用流式分析和 AI 进行异常检测”

阅读教程:“使用 Google Cloud 流式分析和 AI 服务进行实时异常检测”

使用敏感数据保护对大规模数据集中的个人身份信息进行去标识化和重标识处理

此解决方案讨论了如何使用敏感数据保护创建自动数据转换流水线,以便对个人身份信息 (PII) 等敏感数据进行去标识化处理。本检查和迁移解决方案可从存储系统(如 Amazon S3 和 Cloud Storage)读取结构化和非结构化数据。您可以使用 DLP API 自动对数据进行去标识化处理,并将其发送到 BigQuery 和 Cloud Storage。

阅读教程:“使用敏感数据保护对大规模数据集中的个人身份信息进行去标识化和重标识处理”

GitHub:使用 Dataflow/Beam 和 DLP API 进行数据令牌化概念验证

对上传到 Cloud Storage 的数据进行自动分类

本教程介绍如何使用 Cloud Storage 和其他 Google Cloud 产品实现自动化数据隔离和分类系统。

阅读教程:“对上传到 Cloud Storage 的数据进行自动分类”

使用 Dataflow 将关系型数据库导入 BigQuery

此概念验证使用 Dataflow 和敏感数据保护功能,安全地令牌化关系型数据库中的数据并将其导入 BigQuery。该示例介绍了如何将此流水线与在 Google Kubernetes Engine 中创建的示例 SQL Server 数据库结合使用,以及如何使用敏感数据保护模板在个人身份信息数据保留之前对其进行标记化处理。

GitHub:使用 Dataflow 和敏感数据保护将关系型数据库导入 BigQuery

使用敏感数据保护代理查询包含敏感数据的数据库的示例架构

此概念验证架构使用代理通过一项服务传递所有查询和结果,该服务会解析、检查然后记录发现结果,或使用敏感数据保护对结果去标识化。然后再将请求的数据返回给用户。请注意,如果数据库已存储经过令牌化处理的数据,则在返回请求的数据之前,也可以使用此代理概念进行去令牌化处理。 阅读教程:“使用敏感数据保护代理查询包含敏感数据的数据库的示例架构”

视频

Cloud Next '20:OnAir:在混合环境中管理敏感数据

云上和云下的企业环境中都存在敏感数据。无论数据位于何处,正确管理这些数据至关重要。在本课程中,我们将展示敏感数据保护功能如何帮助您管理数据,重点介绍对检查混合环境(如本地环境、虚拟机中运行的数据库、其他云提供商上托管的文件、Kubernetes 内流动的数据等)中的内容提供支持。

YouTube:SEC206:管理混合环境中的敏感数据

阅读教程:“适用于 Envoy 的敏感数据保护过滤器”

阅读教程:“使用 JDBC 对 SQL 数据库进行敏感数据保护混合检查”

Cloud OnAir:保护 Google Cloud 中的敏感数据集

数据是贵公司最宝贵的资产之一。Google Analytics(分析)和机器学习技术可帮助您为客户和企业挖掘有价值的服务。 这些数据集还可以包含需要保护的敏感数据。在本在线讲座中,您将了解敏感数据保护如何在整体治理策略中帮助您发现敏感数据并对其进行分类和去标识化。

YouTube:Cloud OnAir:保护 Google Cloud 中的敏感数据集

Cloud Next 2019:Scotiabank 分享其在将 PII 提取到 Google Cloud 时所采用的云原生方法

具有举足轻重地位的国际性银行 Scotiabank 讨论了其在将个人身份信息提取到 Google Cloud 中、限制访问并谨慎选择允许银行应用进行重识别化处理方面的安全历程和所采用的云原生方法。

YouTube:全面保护 Google Cloud 中的个人身份信息 (Cloud Next '19)

Cloud Next 2019:识别和保护云端的敏感数据

该团队分享了在敏感数据保护方面取得的最新进展,并演示了几种保护您的敏感数据的不同技术。

YouTube:识别和保护云端的敏感数据:Google Cloud 中的最新创新技术 (Cloud Next '19)