赤山之子 发表于 2023-8-7 15:00:43

因错误率较高,OpenAI被迫叫停AI内容识别软件

美国当局但愿大型人工智能公司能够披露那些使用人工智能创建的内容。另一边,欧盟即将要求一些科技平台在其人工智能生成的图像、音频和视频上打上“显著标识表记标帜”,以便奉告大众这些东西是合成而来的。

然而,这里有一个大问题:识别人工智能缔造的内容是一个巨大的技术挑战。目前可用的最佳选择是采纳同样由人工智能驱动的检测东西和水印,但是它是检测成果纷歧致、不准确等错误谬误。

事实上,就在本周由于错误率过高,OpenAI 封锁了本身的人工智能检测东西。

http://pic2.zhimg.com/v2-d678ce4bda0f8144a0d9cfd843e009dd_r.jpg

(来源:通义万相)

但另一种方式比来引起了人们的注意:C2PA。它于两年前推出,是一种开源的互联网协议,依靠暗码学来对内容出处的细节进行编码。

C2PA 的开发人员经常将该协议比作“营养成分标签”,它标明了内容来自哪里,以及是谁或什么缔造了它。

该项目长短营利组织联合开发基金会(Joint Development Foundation)的一部门,由 Adobe、Arm、英特尔、微软和 Truepic 倡议,它们成立了内容来源和真实性联盟,英文全称为 Coalition for Content Provenance and Authenticity,C2PA 也由此得名。

目前,有 1500 多家公司通过开源社区“内容真实性倡议”(CAI,Content Authenticity Initiative)参与了该项目,此中包罗尼康、英国广播公司(BBC)和索尼等多家知名机构。

近来,随着人们对人工智能检测和监管的兴趣增强,上述项目的势头越来越大。C2PA 主席安德鲁·金克斯(Andrew Jenks)暗示,在过去六个月里会员数量增加了 56%。

知名媒体平台 Shutterstock 已经作为成员插手,并颁布发表筹算使用这一协议来标识表记标帜其平台上所有由人工智能生成的内容,包罗其由 DALL-E 驱动的人工智能图像生成器。该平台的 CEO 萨耶·阿敏(Sejal Amin)在一封电子邮件中告诉《麻省理工科技评论》,该公司正在通过“撑持系统和基础设施的开发来庇护艺术家和用户,这些系统和基础架构可以缔造更大的透明度,从而轻松识别艺术家的创作与人工智能生成或改削的艺术之间的区别。”

http://pic4.zhimg.com/v2-a5d42154311b901526c678db95195edb_r.jpg
什么是 C2PA,如何使用它?

微软、英特尔、Adobe 和其他主要科技公司于 2021 年 2 月开始研究 C2PA,它们但愿创建一个通用的互联网协议,允许内容创作者选择在其视觉和音频内容上标注其来源信息。但就目前而言,该协议还不适用于基于文本的内容。

最重要的是,该项目具有跨互联网的适应性和功能性,而且任何人都可以免费访谒其底层计算机代码。

发卖内容验证产物的 Truepic 公司已经使用 Revel.ai 演示了该协议到底该如何与深度伪造视频搭配使用。当不雅观众的光标悬停在屏幕右上角的一个小图标上时,会呈现一个关于视频的信息框,此中包罗“包含人工智能生成的内容”的信息披露。

Adobe 还将 C2PA(又被称为内容凭证)集成到了包罗 Photoshop 和 Adobe Firefly 在内的几款产物中。该公司的内容真实性倡议高级总监、C2PA 项目负责人安迪·帕森(Andy Parsons)暗示:“我们认为这是一种增值,可能会吸引更多客户使用 Adobe 东西。”

C2PA 是通过暗码学来庇护内容的,暗码学依赖于一系列代码和密钥来庇护信息不被篡改,并记录信息的来源。更具体地说,它的工作道理是通过一组加密绑定到每个像素的哈希值,来对出处信息进行编码。

与人工智能检测系统对比,C2PA 提供了一些重要的优势,后者能够更好地逃避检测。

水印,是另一种用于识别人工智能生成内容的典型技术。但是,C2PA 是一个比水印更加尺度化的系统,在某些情况下比水印更容易查看。同时,该协议还可以与水印以及其他人工智能检测东西一起使用。

http://pic4.zhimg.com/v2-709a722e6b5c496f16099f8fa361a03b_r.jpg
信息来源的价值

在媒体中添加来源信息以冲击虚假信息,并不是一个新想法。早期研究似乎表白这是有但愿的:例如,此前牛津大学团队在研究中发现,有证据表白用户在获得有关内容的出处信息之后,往往不太容易受到错误信息的影响。

事实上,在 OpenAI 关于其人工智能检测东西的迭代上,该公司暗示它正在专注于其他“来源(披露)技术”,以满足相关方面的披露要求。

也就是说,来源信息远不是一个万无一掉的解决方案。美国信息完整性中心主任、纽约布法罗大学传授 Siwei Lyu 暗示,C2PA 不具有法令约束力,如果不要求在互联网范围内采用该尺度,那么未标识表记标帜的人工智能生成内容就会始终存在。

尽管他强调该项目仍然非常重要,但是他也暗示:“缺乏全面的约束力使得这项工作存在内在缝隙。”

此外,由于 C2PA 依赖创作者选择插手,该协议并未真正解决不良行为者使用人工智能生成内容的问题。目前,还不清楚元数据的提供到底能给公众媒体流畅性带来多大辅佐。

因此,该联盟最重大的挑战可能是鼓励整个互联网生态系统广泛地采用它的技术,尤其是鼓励社交媒体平台积极使用。

在 C2PA 协议的设计中,它会全方位地追溯出处信息。比如,一张照片的出处信息从相机拍摄、到它进入社交媒体时城市被编码。但是,如果社交媒体平台不使用该协议,它就不会显示照片的出处数据。

目前,尚无主流社交媒体平台采用 C2PA。推特原本已经签署了该项目,但在埃隆·马斯克(Elon Musk)接手撤退退却出了。该公司也暂停了参与其他以自愿参与为基础的项目,而这些项目的重点大都是为了遏制错误信息。

不外,C2PA 并不是“万能药”,它不能解决所有的错误信息问题,但它确实为共有的客不雅观现实奠基了基础。

“(因此)在 Meta 上分享内容之前,你不必知道它是从哪里来的,但如果你想的话你可以选择这样做。鉴于生成媒体的惊人能力,我们认为这样做的能力至关重要。”安迪·帕森暗示。

作者简介:泰特·瑞安·莫斯利(Tate Ryan-Mosley),《麻省理工科技评论》的高级技术政策记者。
页: [1]
查看完整版本: 因错误率较高,OpenAI被迫叫停AI内容识别软件