AI Workshop 让客户、合作伙伴、研究人员和开发者有机会试用最前沿的 AI 创新技术。我们的 AI 研究人员和工程师走在科学技术的最前沿,不断构思新概念、创造新技术并构建新应用,并且希望您试用这些成果。
进行中的实验
-
使用半监督式学习标注图片
提交几张已标注图片(每类最少 5 张)和大量未标注图片(几十万张或更多),即可收到所有未标注图片的预测标签。
-
概念性图片说明
这项实验利用 Google 最先进的多模态理解模型,可对图片进行概念性描述。某些应用要实现的场景十分需要对图片进行流畅、准确的自然语言描述,对图片的概念性描述就可以在这些应用中派上用场。
-
语义反应器
从 Google 表格方便地直接使用最先进的自然语言理解 (NLU) 模型。编写回复,选择模型,选择排名方式,发送查询。可用于机器人制作、游戏和其他语义实验。
-
图表的半监督式学习
这项实验采用一张包含小比例已标注实例(种子)的图表,并根据用户提供的相关项之间的相似度权重,将标签传播到所有未标注项。当客户有自己的数据图(或者可以很方便地生成数据图),但发现标注每个节点很昂贵或者很费时间的时候,这个实验就会特别有用。
-
自然语言的情感分类
理解文本的情感内涵可以提供有关用户或内容的有价值洞察,在客户反馈、评价、客户服务和产品品牌塑造等领域尤其如此。这项实验将文本按喜悦、逗乐、感激、惊讶、反对、悲伤、愤怒、困惑等情绪进行分类。
-
利用语义特征增强数据
通过这项实验,客户可以将稀疏的数据(如网址、查询或文本)转换为密集特征,这些特征在语义上是有意义的,易于调试且易于解释。客户提交一个包含稀疏特征和标签的数据集,我们会返回一个查找表,使用从相同的稀疏特征生成的语义特征来增强其他数据集。
-
生成专业的知识图谱
知识图谱是有价值的工件,但为某一特定领域构建知识图谱的成本非常昂贵。本项目旨在提供一种自动化的方法,通过分析用户上传的文档语料库,生成实体/主题/概念的知识图谱。
-
学习有效的损失函数
每当有人要训练一个机器学习模型时,就需要选取一个损失函数来最小化一组训练数据。这项实验提供了一种高效的、数据驱动的方法来学习有效的损失函数,可以在训练过程中学习,也可以根据完整的训练运行结果来学习(类似传统的超参数调优)。
-
联合学习咨询交流时间
有一种称为联合学习的新兴机器学习方法,可以在分散的数据集上开展机器学习。这种方法在保护数据隐私的同时,还可以提高本地速度和性能。在这项实验中,您可以和 Google 的专家讨论您在联合学习方面的工作,包括使用开源的 TensorFlow Federated 库的情况。
-
汇总多个短文本
通过这项实验,客户可以训练一个 Summarizer 模型,提取短文本(如餐厅评价)并输出所有这些文本的规范化摘要(比如一份该餐厅的评价摘要)。
-
差分隐私咨询交流时间
机器学习模型可以记忆数据,但这可能会带来隐私方面的挑战。有些技术可以测量这种记忆方式,并以更具隐私性的方式训练模型。这项实验允许用户向 Google 专家咨询如何使用开源的 TensorFlow Privacy 库训练机器学习模型,使其具有差异化隐私。
-
计算视频中的离散动作
通过这项实验,客户可以统计一个或多个视频片段中特定动作出现的次数。客户提供一个包含该动作完整周期的视频片段,以及一些该动作(可能)发生的(未标注)视频片段。针对每个片段,他们会收到一个该动作发生次数的计数。
-
视频标签传播器
通过这项实验,客户只需标注一个视频中的帧,就可以同时标注相关的多个视频中的帧。我们的系统将标签从一个视频传播到所有其他视频。
-
图片的标签错误检测
在这项实验中,客户提供他们的已标注训练图片,我们将针对其运行一系列质量检查工具,然后返回一个可能拥有错误标签的训练图片列表。
-
自然语言的语义相似性
针对一段给定的文本,在候选文本名单中找到最相似或相关的文本项。这项实验建基于自然语言使用中的关联性,有助于根据意义和用法而非简单的关键词将项目联系在一起。
-
混合整数线性规划求解器
求解混合整数线性规划问题,即给定一组约束条件的连续变量和整数变量的优化方程系统。Google 每天都在使用这个求解器来处理大规模和关键业务的优化挑战。它可应用于分配、调度、包装和流程问题。
-
具有置信度分数的图片分类
当我们知道可以在多大程度上依赖某项预测时,AI 系统的作用就会大增。这项实验生成了一个 AI 模型,该模型不仅能返回预测类别,还能返回精准的预测置信度评分。
-
提供原型的可解释图片分类
我们可以通过显示训练数据中最相似的项来更好地解释模型预测。客户提供他们的数据,我们则返回一个分类器,其中不仅能预测输出,还能提供相关示例(原型)来解释该决策。
-
针对图片分类的增强学习
在数据不足和/或标签不完整或不完美的情况下,提高图片分类模型的性能。输入您的现有训练数据,即可获得两个 CNN 模型:一个仅用您的数据训练,另一个则用我们的增强学习技术训练。
-
Turbo 图片过滤器
这项实验利用 Google Vision API 和嵌入模型,过滤出包含目标对象的图片。潜在的应用包括加速数据标注过程,以及快速分类或归档图片。