Snowflake利用生成式AI技术创建合成数据

新知榜官方账号

2023-09-19 23:06:31

什么是合成数据?

合成数据是指人为生成的信息,其既具备与真实数据集相同的特征,又不具体包含任何现实世界数据。生成式AI就特别适合处理这项任务,因为它能轻松分析任何数据集,之后创建出与其模式密切匹配的合成数据。也就是说,企业可以训练AI算法并执行测试和模拟,又不必担心像使用现实世界数据那样暴露私人或敏感信息。

合成数据有着广泛的用途,例如在金融领域用于训练欺诈检测算法以发现伪造交易,在医疗保健领域避免使用敏感的患者数据,并可在零售/营销领域用于创建合成客户并分析其购买行为。根据Gartner公司的研究,受到可访问性、复杂性和可用性等现实问题的影响,企业领导者往往更倾向于使用合成数据、而非真实数据。

Snowflake利用生成式AI技术创建合成数据

Snowflake拥有专门的数据市场,将大量宝贵咨询出售给世界各地的企业,并借此成为全球最大的B2B数据经纪公司之一。除了数以千计的现实世界数据集之外,Snowflake现在还提供由生成式AI算法创建的合成数据集资源。其中一例就是旧金山SynthesisAI公司的合成人脸数据集,其中包含5000张不同面孔的独立图像。

Snowflake的其他生成式AI应用思路除了为AI生成的合成数据开放访问通道之外,Snowflake还开发出多种供客户使用的生成式AI工具。凭借今年内对Neeva(一家由谷歌前员工创立的搜索初创公司)的收购,Snowflake开始尝试在数据集上实现自然语言查询。也就是说,用户将有机会与自己的数据直接对话,通过提出简单问题、而非运行复杂的传统数据科学分析来快速获取见解。Snowflake还与英伟达建立起合作伙伴关系,利用后者提供的NeMoLLM创建平台,让用户能够轻松开发出可访问Snowflake数据的聊天机器人、搜索引擎等生成式AI应用。

本页网址:https://www.xinzhibang.net/article_detail-12487.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯