《纽时》、CNN网页封杀ChatGPT 拒让新闻内容被拿去训练AI ＊阿波罗新闻网

英国《卫报》报导指称，有越来越多媒体为了保护知识产权，在其网页封锁ChatGPT 人工智能（AI）程式利用网络爬虫程式截取其网站内容，用于训练其AI系统。包括美国《纽约时报》、有线电视新闻网（CNN）、路透社、澳洲广播公司（ABC）等媒体都已经采取类似的防堵程式。

多家知名媒体已封锁Chat GPT的爬虫程式，不想让其内容被用于训练人工智能。资料照片

报导指出，由美国人工智能实验室Open AI开发的网络爬虫程式“GPTBot”，会扫描新闻媒体的网页、收集资料，用于AI大型语言模型以及内容生成。但对于上述新闻媒体而言，他们撰写的心血结晶，可能并不想被AI拿去利用。

美国科技网站The Verge稍早指称，《纽约时报》网站可能从8月17日之前就已修改网页指令，封杀GPTBOT，《卫报》深入了解后，发现除了《纽时》，还有CNN、澳洲ABC、美国《芝加哥论坛报》、路透社、澳洲社区新闻集团（ACM）旗下的《堪培拉时报》、《纽卡索论坛报》都已在8月采取类似的封锁措施。

AI内容检查工具OriginalityAI公司稍早的报告也指出，电商巨擘亚马逊（Amazon）、图库网站Shutterstock也都已封锁GPTBot。

类似Chat GPT的语言模型，都需要收集大量资讯来训练其人工智能，才能使用近似人类语言的模式来回答问题，但开发者对于其AI数据库有多少他人的版权内容，三缄其口。

CNN证实近期封锁GPTBot进入其网页爬梳，路透社发言人则说；“智慧财产是我们业务的命脉，保护我们内容的版权至为重要。”《纽时》公司发言人说，最近更新该网站的服务约定条款，旨在更明确表达禁止撷取我们的内容，用于AI训练与开发。

AI使用于收集新闻的范围日渐扩大，全球新闻媒体都面临这种要不要让AI吸取内容的决定。法新社与图片交易公司Getty Image（盖帝图像）在今年8月初发表一封公开信，呼吁加强规范人工智能的使用，对其用于训练的内容增加透明度，并应取得版权持有者的同意。也在进行人工智能软件开发的Google公司声称，AI系统应该有权撷取其他出版物用于创造AI模型，“除非对方有提出反对”。

责任编辑：楚天　来源：壹𬞟新闻网转载请注明作者、出处並保持完整。

《纽时》、CNN网页封杀ChatGPT 拒让新闻内容被拿去训练AI

相关新闻