自OpenAI推出内容生成式人工智能模型以来,网络上的数据被广泛应用于训练和改进这些模型。然而,根据路透社研究所的调查显示,越来越多的新闻媒体开始对OpenAI的数据采集表示疑虑,甚至有超过50%的传统媒体对此持反对态度。这表明对数据隐私和使用的关注正在增加,并提醒人们在人工智能发展过程中需要更多的透明度和合规性。
路透社研究所分析了《纽约时报》、《华尔街日报》、《华盛顿邮报》、CNN、NPR 等多家主流新闻媒体,涵盖美国、英国、德国、印度等10个国家,并将其归为传统印刷媒体(纸媒)、广播电视媒体、数字媒体三大类。研究发现,57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序,广播电视媒体和数字媒体的比例分别为48%和 31%。
研究还指出,不同国家和地区屏蔽 OpenAI 的新闻网站比例存在显著差异。在美国,这一比例高达79%,而在墨西哥和波兰则仅为20%。
所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异
此外, 在屏蔽了OpenAI 爬虫的新闻媒体中,有97%也同样屏蔽了谷歌人工智能的爬虫。
某些研究揭示了新闻媒体对人工智能使用其内容持谨慎态度。他们担心,如果人们通过人工智能获取新闻,可能导致媒体被边缘化或替代。Gartner副总裁兼杰出分析师安德鲁·弗兰克指出:“路透社的研究突显了生成式人工智能所面临的一个核心挑战:它的运作依赖于真实个体创造的真实内容,而这些个体可能视之为对其谋生方式的潜在威胁。”
近期,康奈尔大学的一项研究指出,当新的人工智能模型在训练过程中主要依赖于先前模型而非人类提供的数据时,往往会出现“模型崩溃”或退化的情况。这导致人工智能系统生成的信息中出现更多错误。这一现象突显了在人工智能领域中存在的潜在风险和挑战,需要更深入的研究和探讨。这项研究结果提醒我们,在开发人工智能技术时要谨慎对待数据来源和训练方法,以
去年8月初,OpenAI推出了人工智能爬虫,随后谷歌也在9月推出了类似产品。研究指出,如果这些媒体做出了屏蔽决定,可能会很难逆转这一立场并解除屏蔽。
以上是許多主要新聞媒體正在屏蔽 OpenAI 爬蟲的詳細內容。更多資訊請關注PHP中文網其他相關文章!