当前位置: 主页 > 汽车资讯 >

    AI“模子解体”风险需警戒

     时间:2024-09-25 10:20  

    原标题:AI“模型崩溃”风险需警惕

    从客户服务到内容创作,人工智能(AI)影响了众多领域的进展。但是,一个日益严重的被称为“模型崩溃”的问题,可能会使AI的所有成就功亏一篑。

    “模型崩溃”是今年7月发表在英国《自然》杂志上的一篇研究论文指出的问题。它是指用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出。

    多家外媒报道称,这不仅是数据科学家需要担心的技术问题,如果不加控制,“模型崩溃”可能会对企业、技术和整个数字生态系统产生深远影响。天津大学自然语言处理实验室负责人熊德意教授在接受科技日报记者采访时,从专业角度对“模型崩溃”进行了解读。

    “模型崩溃”是怎么回事

    大多数AI模型,比如GPT-4,都是通过大量数据进行训练的,其中大部分数据来自互联网。最初,这些数据是由人类生成的,反映了人类语言、行为和文化的多样性和复杂性。AI从这些数据中学习,并用它来生成新内容。

    然而,当AI在网络上搜索新数据来训练下一代模型时,AI很可能会吸收一些自己生成的内容,从而形成反馈循环,其中一个AI的输出成为另一个AI的输入。当生成式AI用自己的内容进行训练时,其输出也会偏离现实。这就像多次复制一份文件,每个版本都会丢失一些原始细节,最终得到的是一个模糊的、不那么准确的结果。

    美国《纽约时报》报道称,当AI脱离人类输入内容时,其输出的质量和多样性会下降。

    熊德意解读称:“真实的人类语言数据,其分布通常符合齐普夫定律,即词频与词的排序成反比关系。齐普夫定律揭示了人类语言数据存在长尾现象,即存在大量的低频且多样化的内容。”

    熊德意进一步解释道,由于存在近似采样等错误,在模型生成的数据中,真实分布的长尾现象逐渐消失,模型生成数据的分布逐渐收敛至与真实分布不一致的分布,多样性降低,导致“模型崩溃”。

    AI自我“蚕食”是坏事吗

    对于“模型崩溃”,美国《The Week》杂志近日刊文评论称,这意味着AI正在自我“蚕食”。

    熊德意认为,伴随着这一现象的出现,模型生成数据在后续模型迭代训练中占比越高,后续模型丢失真实数据的信息就会越多,模型训练就更加困难。

    乍一看,“模型崩溃”在当前似乎还是一个仅需要AI研究人员在实验室中担心的小众问题,但其影响将是深远而长久的。

    美国《大西洋月刊》刊文指出,为了开发更先进的AI产品,科技巨头可能不得不向程序提供合成数据,即AI系统生成的模拟数据。然而,由于一些生成式AI的输出充斥着偏见、虚假信息和荒谬内容,这些会传递到AI模型的下一版本中。

    美国《福布斯》杂志报道称,“模型崩溃”还可能会加剧AI中的偏见和不平等问题。

    不过,这并不意味着所有合成数据都是不好的。《纽约时报》表示,在某些情况下,合成数据可以帮助AI学习。例如,当使用大型AI模型的输出训练较小的模型时,或者当可以验证正确答案时,比如数学问题的解决方案或国际象棋、围棋等游戏的最佳策略。

    AI正在占领互联网吗

    训练新AI模型的问题可能凸显出一个更大的挑战。《科学美国人》杂志表示,AI内容正在占领互联网,大型语言模型生成的文本正充斥着数百个网站。与人工创作的内容相比,AI内容的创作速度更快,数量也更大。

    OpenAI首席执行官萨姆·奥特曼今年2月曾表示,该公司每天生成约1000亿个单词,相当于100万本小说的文本,其中有一大部分会流入互联网。

    互联网上大量的AI内容,包括机器人发布的推文、荒谬的图片和虚假评论,引发了一种更为消极的观念。《福布斯》杂志称,“死亡互联网理论”认为,互联网上的大部分流量、帖子和用户都已被机器人和AI生成的内容所取代,人类不再能决定互联网的方向。这一观念最初只在网络论坛上流传,但最近却获得了更多关注。

    幸运的是,专家们表示,“死亡互联网理论”尚未成为现实。《福布斯》杂志指出,绝大多数广为流传的帖子,包括一些深刻的观点、犀利的语言、敏锐的观察,以及在新背景下对新生事物的定义等内容,都不是AI生成的。

    不过,熊德意仍强调:“随着大模型的广泛应用,AI合成数据在互联网数据中的占比可能会越来越高,大量低质量的AI合成数据,不仅会使后续采用互联网数据训练的模型出现一定程度的‘模型崩溃’,而且也会对社会形成负面影响,比如生成的错误信息对部分人群形成误导等。因此,AI生成内容不仅是一个技术问题,同时也是社会问题,需要从安全治理与AI技术双重角度进行有效应对。”

  •  
国家文物局:近三年排查整治各类文物安 专业靠谱!民生银行守护好老百姓的“钱 【图解】“五个着力”促进高质量充分就 上海发布工业领域大规模设备更新十大场 为500余位医护人员送去防诈骗知识 南京银 水利工程在建项目多投资大 工程质量如何 国家统计局:租赁和商务服务业是对外投 释放金融动能,助力湾区建设 “交银湾通 中金解读系列政策利好:从范围到力度均 南京银行杭州分行“积存金”——黄金投 上海推出“乐影上海”电影消费券 覆盖十 “建外有爱 生活无碍”:朝阳区建外街道 九部门部署2024年秋粮收购 全力保障农民 车来了APP进驻济南 人保财险数字化赋能消保 筑牢安全守护网 2024年临空经济区可持续发展国际会议开幕 因超过最长学习年限等原因 多所高校对部 规模领先 领域多元 合作共赢——多部门 维信诺打造中尺寸业务增长新动能 合肥国 “壮大耐心资本,培育新质产业” 第二届 临空区大兴片区国际会展消费片区开发建 家园故事|迟来的婚纱照 “灵犀体验计划”再次升级!阳光人寿推 广东:支持东莞探索盘活土地资源有效路 多地废止不符合新时期要求招商引资优惠 体验养老金融服务新场景——走进北京农 破发股九方智投控股港股跌11.3%创新低 中国人民银行开展3000亿元MLF操作 华英证券:唱文化建设主旋律 走精品特色 第二十四届工博会开幕 巨轮智能RV减速器 证监会发布《关于深化上市公司并购重组 生态情况部:以生态情况“含金量”晋升 生态情况部:分阶段、分步调、有打算系 生态情况部:“十四五”以来全国新增完 产业文明国际论坛在沪揭幕 “做好金融五篇年夜文章 撑持村落周全振 消费市场活力足 延续助力经济回升向好 鞭策经济向“新”而行 险资加年夜力度撑 嫦娥六号探测器将初次表态中国航展 国度发改委:消费品以旧换新获得新进展 享万象贸易,拥公场地铁,福永万万年夜 东莞南城高铁站要来了,蛤地定位主枢纽 生态情况部:全国碳市场累计成交量超 证监会就《上市公司监管指引第10号—— 生态情况部:我国已建陈规模最年夜、要 家电、家装厨卫以旧换新今朝进展若何? 全国汽车报废更新补助申请跨越113万份 一箭五星 力箭一号远四运载火箭发射美满 不竭塑造进步前辈制造新动能 产业高质量 习近平回信鼓励普洱平易近族连合誓辞碑 张之臻0:2惜败西里奇 取得杭州网球公然赛 法治中国根底不竭筑牢(奋进强国路 阔 华东理工年夜学:以教育家精力引领一流 为扶植航天强国再立新功 成都网球公然赛商竣程2:0穆塞蒂 首夺AT 苦守初心,不竭实现人平易近对夸姣糊口 “北京普惠健康保”开通主动从头投保办 火箭军向承平洋海域成功发射1发洲际弹道 辛纳、阿尔卡拉斯领衔中网男单签表 商竣 游泳全锦赛首日:浙江队夺三金 孙佳俊刷 日月视频 手机版 欧歌影视仓 免费版 大吉订购 最新版 月光影视仓 手机版 比目鱼影视 官方版 南柯电影网无广告 最新版 巴黎直播 手机版 91日剧 手机版 月兔直播 免费版 泰剧兔官网 免费版 小鱼影视2024 官方版 谷歌街景地图 手机版 dj打碟机模拟器 最新版 嘿嘿动漫 最新版 影视工场播放器 手机版 风筝影视 最新版 星空动漫 最新版 七星直播t 官方版 逗猫动漫 官方版 蜜果酱直播 免费版 河狸影院 最新版 高德地图车机 免费版 花火影院 手机版 hifi音乐电视免费版 松果影视 最新版 今日头条2024 最新版 白泽影视t 最新版 巴士影院 最新版 洋葱T直播 手机版 忍者必须死3vivo免费版 魔剑奇兵折扣官方版 忍者必须死3官服2024官方版 口袋进化微信登录手机版 口袋进化vivo最新版 口袋进化qq登录本官方版 口袋进化应用宝最新版 口袋进化OPPO渠道服官方版 口袋进化小米免费版 555电影正 官方版 天天趣玩红 最新版 地球影视 官方版 小柠檬影视 手机版 电影猎手追剧 免费版 B次元官网正式 免费版 两年半社区安装 最新版 小柚子影视 免费版 姐衣yw二手衣物 最新版 达达龟影视 最新版 乐享音乐 官方版 暖光影视 免费版