如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
2023-06-07 21:50:54来源:ZAKER科技
机器之心发布
【资料图】
作者:之江实验室
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
关键词:
责任编辑:hnmd003
精彩推送
- 如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
- 新消费、新场景、新动能!2023上海消费市场创新大会今日举办
- 今日要闻!港交所:未来内地投资者或可经“港股通”买卖人民币柜台证券
- 警心暖童心|环球最资讯
- 天天关注:全国首条长距离新能源运输试点项目落地山西临汾
- 广州5月商铺成交量同比上升95% 焦点资讯
- 新疆企业职工退休金计算2023 新疆退休养老金2023年上涨方案涨多少?-环球今日报
- 全球通讯!中集安瑞科中标香港首个加氢站项目
- 视频|考生骨折无法走路 警察蜀黍背进考场
- 上海临港新片区管委会与中远海运集团签署战略合作备忘录
- 集采扩面提质!这些中成药、高值耗材将迎来新一轮降价-全球速讯
- 昆船智能06月07日主力资金大幅流出|天天微资讯
- 国网元宝山区供电公司:慰问高考保电一线人员
- 首开股份(600376)6月7日主力资金净买入81.28万元|世界短讯
- 焦点热文:华测检测董秘回复:公司的经营情况良好,一季度营业收入和归母净利润均实现稳定增长
- 时评|在免费早餐里“看见”城市的善良
- 大佬都在用的各种手部姿势绘画教程!你还不来看看!!!!!!!(附赠3000+手部线稿)
- 【全球新视野】国机汽车(600335)6月7日主力资金净买入1200.58万元
- 特效无梦睡眠药水配方在哪买(特效无梦睡眠药水配方)
- 广东:加快发展保障性租赁住房,对子女较多家庭适当提高租赁补贴标准|天天速递
- 上海临港新片区管委会与中远海运集团签署战略合作备忘录
- SUV买空间还是买操控?你会接受一台更家用的马自达吗?CX-50实拍_世界微头条
- 天天滚动:联创光电(600363)6月7日主力资金净卖出73.20万元
- 下属公司累计被冻结5个银行账户,海南椰岛今日股价开盘即下跌
- 美媒称布林肯将在几周内访华,中方能否证实?外交部回应|全球观焦点
- 焦点简讯:苹果MR开发套件已开放申请 中国开发者期待推动3D内容生态
- 钉钉的抄送人是什么意思(钉钉抄送人是什么意思) 当前焦点
- 永泰能源:公司无形资产主要为矿业权资产,为公司开展主营业务和增强发展后劲而配置相关资源_环球新资讯
- 全球简讯:沉睡魔咒电影百度云在线观看(沉睡魔咒电影百度云)
- 卢帅2023AI造物计划团练课第1期_世界播资讯
- 6月6日利率债市场收益率整体下行|今日快看
- 每日快播:商务预报:5月29日至6月4日猪肉零售价格略有下降
- 环球今日讯!广汇汽车:2022年,公司在新能源汽车销售和服务方面,借助自身在行业内的影响力,积极参与新能源市场布局
- 森麒麟:公司4、5、6月份订单远超公司现有产能,预计下半年出口订单依然饱满
- 2023年3月合肥海关进出口总额及进出口差额统计分析_看点
- 服务考生勇担使命 冷水江民兵爱心送考车队如约出发
- 世行上调今年全球和中国经济增长预期
- 天奥电子:中电十所是公司的控股股东,中电天奥是中国电科的全资子公司 环球短讯
- 快消息!华测检测:公司的经营情况良好 一季度营业收入和归母净利润均实现稳定增长
- 【世界播资讯】布局武汉!神农架酱酒体验馆开业
- 优秀幼儿教师个人简介_幼儿个人简介怎么写|每日短讯
- 世界聚焦:保价到年底,哈弗枭龙系列下订立享2000元抵8000元
- 环球今热点:全球连线丨中国千年古村落里的古建筑守护者
- 跨境电商品牌化的背后,是时间与深度-天天播资讯
- 宁夏银川:专场招聘促就业_视焦点讯
- 北京开启不动产登记“跨省通办”新模式-焦点热文
- 【热闻】【收评】沥青日内上涨0.65% 机构称沥青6月份国内计划排产量仍处高位
- 克明食品:1-5月累计销售生猪24.01万头,同比增长78.20%
- 环球热头条丨红色预警!学校紧急停课!
- 江西开展食品安全专项抽检
- “既独具特色,又可与世界对话”:摩尔多瓦前总统彼得·鲁钦斯基来访,盛赞郎酒庄园之美
- 当前热讯:禁毒宣传进校园:远离毒品,让青春充满阳光
- 【环球报资讯】华为云张平安:数据库是软件产业的根技术 理应做大做强
- 河南省已确定745个定点收储库点 挂牌敞开收购受损小麦
- “太难了!”出境游为何“签证难”?何时能好转?
- 天天观热点:桌面文档删除怎么恢复 桌面文档删除了怎么恢复
- 天天观速讯丨通达创智:现已开发、销售适合儿童使用的相关产品
- 2023金融消费安全论坛暨金融消费帮扶工程启动仪式在京举行
- 每日播报!丹东全域智慧养老服务云平台已覆盖3.2万余名困难老人
- 著名经济学家徐洪才:中国新型城市化还有后半场,到2050年要建立现代化国家
- 华微电子(600360)6月7日主力资金净卖出809.06万元_环球快播
- 保价到年底,哈弗枭龙系列下订立享2000元抵8000元|当前头条
- 斯宾塞祝贺《暗黑4》发售 开服后爽玩了18小时!
- 和胜股份:在项目研发前沿领域一直与宁德时代深度合作
- 明星基金继续押注中国股票:每一次下跌都是买入好机会
- 退市未来(600532)6月7日主力资金净卖出233.37万元-天天讯息
- 天天热推荐:电影《速度与激情10》票房破9亿
- 【新视野】前脸更加凌厉,雷克萨斯TX最新预告图公布
- 苏州烟草网站_苏州烟草网上订货平台新商盟 焦点热闻
- 环球观察:恒大物业连发三份业绩报:2022年成功扭亏 134亿元被占资金正与恒大商议
- 香港首场VTuber演唱会「Virtual Fes 2023-香港站」,青瞳视觉提供全程Motion Capture 技术支持_全球最新
- 环球微速讯:国网元宝山区供电公司:高考保电我在岗 学子圆梦我护航
- 演讲家网_演讲家
- 琪金集团饲养技术新突破 荣获国家猪用中草药液饲喂器实用新型专利 最新消息
- 以其昏昏使人昭昭的意思是什么生肯_以其昏昏使人昭昭的意思
- 当前时讯:于丹:ChatGPT写的作文毫无灵性和才情
- 天天速讯:2023阿里巴巴全球数学竞赛进入决赛时刻
- 象棋棋盘图片_象棋棋谱图片
- 【收评】菜油日内上涨0.10% 机构称油脂反弹乏力 热资讯
- 重庆最大高速公路投资项目“进度条”过半|每日精选
- 小号托管平台下载_小号托管
- 全球快消息!数百名非法移民冲过美墨边境大桥 墨西哥边防人员被撞倒
- 全球即时:A股360只个股股价跌破每股净资产 ST世茂、荣盛发展、退市未来市净率最低
- 【播资讯】股市啥时候能翻身?
- 专访兰世立:首富只是虚名,任何一个行业都需要“疯子”-焦点简讯
- 双星新材股东户数下降1.34%,户均持股10.48万元|全球聚焦
- 山东以科技赋能新旧动能转换 挺起现代化产业体系“脊梁”_焦点信息
- 区征收中心召开莘庄工业区存量安置房源协调推进会|全球今日讯
- 当前速讯:高质量发展背景下的信托业蝶变
- 申购费率什么意思_什么是基金申购费率 环球热点评
- 再获殊荣!国王运动训练组和装备经理均被评为TA NBA年度最佳_天天热讯
- 港股异动 | ASMPT(00522)涨超5% 机构称行业景气回升驱动戴维斯双击 天天新要闻
- 回归法律服务初心 促行业高质量发展
- 国企领导出差与年轻女子牵手逛街?中央巡视组:将督促查实 全球热消息
- 天舟五号货运飞船完成与空间站组合体再次交会对接
- 送法进社区 普法入民心
- 罗技G Pro Wireless一代游戏鼠标降价促销:到手价不高于399元
- 今日黄金td行情分析(2023年6月7日)
- 北京高考考点多措并举 两次刷脸避免走错考场
- 南方东英发行跨境跨市场基金 布局东南亚和南亚数字经济机会 世界微资讯