新闻 > 科教 > 正文

《纽时》、CNN网页封杀ChatGPT 拒让新闻内容被拿去训练AI

英国《卫报》报导指称,有越来越多媒体为了保护知识产权,在其网页封锁ChatGPT人工智能(AI)程式利用网络爬虫程式截取其网站内容,用于训练其AI系统。包括美国《纽约时报》、有线电视新闻网(CNN)、路透社、澳洲广播公司(ABC)等媒体都已经采取类似的防堵程式。

多家知名媒体已封锁Chat GPT的爬虫程式,不想让其内容被用于训练人工智能。资料照片

报导指出,由美国人工智能实验室Open AI开发的网络爬虫程式“GPTBot”,会扫描新闻媒体的网页、收集资料,用于AI大型语言模型以及内容生成。但对于上述新闻媒体而言,他们撰写的心血结晶,可能并不想被AI拿去利用。

美国科技网站The Verge稍早指称,《纽约时报》网站可能从8月17日之前就已修改网页指令,封杀GPTBOT,《卫报》深入了解后,发现除了《纽时》,还有CNN、澳洲ABC、美国《芝加哥论坛报》、路透社、澳洲社区新闻集团(ACM)旗下的《堪培拉时报》、《纽卡索论坛报》都已在8月采取类似的封锁措施。

AI内容检查工具OriginalityAI公司稍早的报告也指出,电商巨擘亚马逊(Amazon)、图库网站Shutterstock也都已封锁GPTBot。

类似Chat GPT的语言模型,都需要收集大量资讯来训练其人工智能,才能使用近似人类语言的模式来回答问题,但开发者对于其AI数据库有多少他人的版权内容,三缄其口。

CNN证实近期封锁GPTBot进入其网页爬梳,路透社发言人则说;“智慧财产是我们业务的命脉,保护我们内容的版权至为重要。”《纽时》公司发言人说,最近更新该网站的服务约定条款,旨在更明确表达禁止撷取我们的内容,用于AI训练与开发。

AI使用于收集新闻的范围日渐扩大,全球新闻媒体都面临这种要不要让AI吸取内容的决定。法新社与图片交易公司Getty Image(盖帝图像)在今年8月初发表一封公开信,呼吁加强规范人工智能的使用,对其用于训练的内容增加透明度,并应取得版权持有者的同意。也在进行人工智能软件开发的Google公司声称,AI系统应该有权撷取其他出版物用于创造AI模型,“除非对方有提出反对”。

责任编辑: 楚天  来源:壹?新闻网 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2023/0825/1945544.html