研究发现:AI公司依赖优质出版商提供训练数据,全新洞察

发布时间: 2024-11-10 10:33:29

近年来,大型科技公司如OpenAI、Google、Meta和Anthropic在训练它们的大语言模型(LLMs)时,广泛使用了来自权威出版商的高质量、受版权保护的材料。根据Ziff Davis的一项研究,这些高质量内容对提升AI模型的性能至关重要,但它们的贡献往往被忽视。Ziff Davis是CNET、IGN和Mashable等媒体的母公司,其研究显示,科技公司在选择训练数据时,偏好权威性高、搜索引擎排名靠前的网站,因为这些网站的内容质量高,声誉良好。这种策略帮助AI开发者更好地调整语言模型。

1. 研究指出,顶级的内容提供商如Axel Springer、Future PLC、Hearst、News Corp和《纽约时报》等,对训练数据集的构建做出了贡献。特别值得一提的是,OpenWebText2(用于OpenAI的GPT-3模型)中有12.04%的数据来自这些可信赖的出版商。

2. 关于AI训练中使用内容的争议,Facebook(Meta)的创始人马克·扎克伯格在接受The Verge采访时表示,数据抓取对AI发展虽然具有挑战性,但单个创作者或出版商的内容在整体中所占的重要性可能被高估了。他指出:“我认为个体创作者或出版商往往高估了他们的内容在整体大局中的价值。”

3. 出版商对AI公司提起诉讼,表明训练数据来源的不透明引发了他们的担忧。《纽约时报》和《华尔街日报》最近对一些AI公司提起了诉讼,指控它们未经许可使用其内容,违反了版权法。尽管OpenAI已经在努力从媒体机构如《金融时报》和DotDash Meredith获取内容授权,但仍有一些AI公司未获得适当的许可。报告还指出,大型语言模型开发者如今已不再像过去那样公开他们的训练数据。

与此同时,随着AI公司的估值不断攀升,科技巨头与传统媒体公司之间的差距也在扩大。Google和Meta的估值分别达到了2.2万亿美元和1.5万亿美元,继续引领生成式AI的发展,而OpenAI和Anthropic等初创公司的估值则分别为1570亿美元和400亿美元。相比之下,传统出版商仍在面临裁员和重组的压力,这反映了他们在适应日益被AI定义的环境中所承受的经济压力。与用户生成内容和AI生成内容的竞争,使得许多出版商在削减成本和员工方面面临挑战。

权威出版商在AI训练中的贡献不可忽视,但其内容的使用也引发了版权争议。科技公司与传统媒体之间的经济差距和法律纠纷,凸显了这一快速发展的领域中各方利益的复杂性。

声明:文章不代表第一币讯的观点及立场,不构成本平台任何建议。新闻资讯仅供参考,投资决策应当理性谨慎。
警惕: 网上好友、短信、电话、群聊都是骗子,请大家注意防止受骗!

相关新闻

全新研究:XRP估值高达3500至22000美元,市场潜力尽显

一项新研究对XRP的估值在3,500美元至22,000美元之间,这一预测在加密货币社区引起了广泛关注,尤其是随着XRP的增长势头不断加强。 这项研究由Valhil Capi... [详情]

以太坊模块化战略:短期阵痛,长期获益,研究如是说

2024年11月12日,Web3风险投资公司Hack VC发布了一份关于以太坊模块化战略的研究报告。报告分析认为,以太坊的模块化策略在短期内可能会对其价格产生负面影... [详情]

生成式AI使用率飙升至75%:微软研究报告深度解析

微软与IDC近期联合发布的一项研究显示,企业对生成式AI解决方案的偏好持续上升,使用率猛增至75%。这一趋势源于企业希望通过AI技术创造持久的商业价值。研究... [详情]

XRP公允市值最新研究:或高达3,500至22,000美元权威解析

近日,加密货币领域的知名影响者Amelie在推特上分享了一项关于XRP市场公允价值的研究。该研究由Valhil Capital的董事总经理Jimmy Vallee和其区块链业务的... [详情]

Ethereum研究人员因利益冲突紧张局势撤离EigenLayer:最新深度解析

以太坊研究员Justin Drake和Dankrad Feist最近宣布辞去他们在EigenLayer的顾问职务,EigenLayer是一个再质押平台。这一消息是在社交平台X上发布的,两位研... [详情]

Ethereum研究团队陷争议,全面撤离EigenLayer项目深度解析

以太坊生态中的两位重要研究者Justin Ðrake和Dankrad Feist近日宣布了一项重大决定,标志着以太坊发展方向的显著变化。两人都退出了去中心化再质押协议Ei... [详情]

加密用户数暴增,研究人员最新估计揭秘

最近,著名风险投资公司a16z,即Andreessen Horowitz,发布了一项关于加密货币领域的研究报告。该研究揭示了加密货币的活跃用户数量可能远高于之前的估计。... [详情]

阿拉米达研究持续在币安存入世界币(WLD)

最近,阿拉米达研究公司(Alameda Research)继续调整其资产组合。一系列交易显示,其将所持有的Worldcoin(WLD)转入币安平台。阿拉米达研究公司正处于重组钱包... [详情]

以太坊ETF上市后将超越比特币:K33研究报告揭秘

K33 Research的分析师认为,以太币(ETH)现货交易所交易基金(ETFs)的推出可能会让这种加密货币在推出后的几周内表现超过比特币(BTC)。预计这些ETFs最早将在... [详情]

ETH超越BTC在即:K33研究揭示现货以太坊ETF启动影响

最近有消息说,以太坊(ETH)的交易所交易基金(ETF)可能会在7月8号左右推出。分析师们认为,这个新基金的推出可能会让以太坊的表现超过比特币(BTC),尤其是在... [详情]

全球热门币种

  1. Bitcoin 比特币BTC
  2. Ethereum 以太坊ETH
  3. Tether 泰达币USDT
  4. BNB 币安币BNB
  5. USDC USDC
  6. XRP 瑞波币XRP
  7. Dogecoin 狗币DOGE

意见反馈及报错将在两个工作日内及时处理 投诉举报

增值电信业务经营许可证备案号:京ICP备16030243号-1