大模型时代的数据安全与监管

新知榜官方账号

2023-08-17 01:31:09

妙鸭相机火了,用户数据安全问题凸显

妙鸭相机火了。无需高额的价格、无需耗时的定妆,只需要9.9元和20张个人照片,就可以利用AI生成媲美“海马体”“天真蓝”的精美照片。凭借低廉的价格和较好的生成效果,“妙鸭相机”一经推出便迅速出圈。不过,这次出圈的不止是产品,还有当时近似“霸王条款”的用户协议。

面对用户的质疑,妙鸭相机很快修改了相关条例,并在官方公众号、小红书等多个平台发布了道歉声明,直言:已经收到用户关于用户协议的反馈,原协议内容有误,已第一时间根据妙鸭的实际情况进行了修改。

事实上,一直以来,“互联网服务与数据安全难以两全”都是一个棘手的问题。妙鸭相机用户协议授权问题,仅仅是互联网数据安全问题的一个缩影。长期专注于数据合规领域的北京植德律师事务所合伙人王艺告诉「甲子光年」:“目前有较多因为‘AI换脸’软件产生的侵权案件,利用AI技术侵犯个人隐私数据的案例数量也在逐步上升。”用户处于被动位置,难以保障自身的数据安全,隐私保护的无力感正在从互联网时期蔓延至AI时代。但显而易见的是,在AI时代,企业对数据的争夺更加激烈,用户数据隐私安全面临的挑战也更加严峻。

大模型时代,数据安全的新挑战

数据,是AI发展的养料。人们在轻而易举获取数据的同时,对数据安全的讨论也此起彼伏。相较于互联网对用户上网习惯、消费记录等信息的覆盖,人脸识别、智能设备、AI换脸等AI应用的出现,对用户个人信息的采集范围大幅扩大,包括人脸、指纹、声纹、虹膜、心跳、基因等强个人属性的生物特征信息。

市场逐渐凝成这样的共识:得数据者得天下,数据是大模型竞争的关键。顶象安全专家告诉「甲子光年」:“模型需要数据来训练。数据除了自己采集,就是爬虫爬取。爬取的数据大部分没有经过数据所有者允许,可以说大部分是非授权的盗用。”

GPT-3的数据量已经直接飞升至45TB(相当于GPT-2数据量的1152倍)。市场逐渐凝成这样的共识:得数据者得天下,数据是大模型竞争的关键。顶象安全专家告诉「甲子光年」:“模型需要数据来训练。数据除了自己采集,就是爬虫爬取。爬取的数据大部分没有经过数据所有者允许,可以说大部分是非授权的盗用。”

数据安全与监管的平衡

隐私计算和合成数据成为解决方案之一,同时监管也需要平衡好数据安全和AI的发展。隐私计算可以在不泄露原始数据的前提下对数据进行分析计算,实现数据的共享、互通、计算和建模。合成数据可以基于真实数据样本生成虚拟数据,因此也不存在用户的个人隐私信息。全球IT研究与咨询机构Gartner预测,2030年,合成数据的体量将远超真实数据,成为AI研究的主要数据来源。

在监管方面,对AI的监管需要有主次之分:重点在应用层的监管,尤其是内容监管和个人信息安全;其次是基础层和模型层的监管,对于相关深度合成算法要督促其及时完成备案;再次是要关注技术本身的主体是否涉及境外,可能会存在数据出境、出口管制等问题。每一次技术产生变革的时期,期待和恐惧总是如影随形,发展和监管的呼声向来不相上下。目前大模型的发展还在早期,应用层的爆发尚未实现,但AI不会停下脚步,如何把控前行的方向,如何平衡安全与创新,或许是AI发展历程中持续伴随的命题。

本页网址:https://www.xinzhibang.net/article_detail-9941.html

寻求报道,请 点击这里 微信扫码咨询

关键词

大模型 数据安全 隐私保护 监管 合成数据 隐私计算

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯