随 AI 模型的发展训练数据也成了新兴市场,AI 公司与数据供应方签订协议,如同近期上市的美国论坛 Reddit 便同意授权平台内容给 Google。因此《路透社》采访了 30 多名 AI 数据交易相关人士,来探究当前市场规模。
由於许多 AI 公司不愿透露协议内容,一些主要市场研究公司并未开始估算 AI 数据市场规模,但像 Business Research Insights 等研究机构估该市场目前约为 25 亿美元,并预测十年内可能成长至 300 亿美元。一名为内容所有者提供数据授权谘询服务的律师表示,现在有一波寻找版权拥有者的热潮。
像 Shutterstock 与 Meta、Google、亚马逊和苹果等大公司皆达成授权协议,根据 Shutterstock 这些交易最初每笔金额为 2500 万美元至 5000 万美元,後续合作规模持续扩大。
Shutterstock 的竞争对手 Freepik 则与两家大型科技公司达成协议,以每张图像 2 至 4 美分的价格授权了将近 2 亿张图像。
AI 公司 Defined.ai 也授权数据给 Google、Meta、微软在内等多间科技公司,并分享这些科技公司通常愿意为每张图片支付 1 至 2 美元、短影片为每段 2 到 4 美元,较长影片则是每部 100 至 300 美元,至於文字内容市场的价格则是每个字 0.001 美元。
Defined.ai 指出需要仔细处理的裸体图像售价较高,落在 5 至 7 美元,另一间匿名图像供应商也指出最昂贵的图像便是敏感内容,他们主要从警察、自由摄影记者和医学生来取得相关照片,而 AI 公司会加以用来防止模型生成违规内容。
AI 数据生意也让过去的平台取得新商机,Photobucket 是在 2000 年代盛行的图像寄存服务网站,寄存的内容常被用於 Myspace 等社群网站上,Photobucket 用户数曾高达 7000 万,在美国线影像网站市场中市占率近一半。
如今 Photobucket 只剩 200 万名用户,但 AI 兴起所带动的资料授权生意让 Photobucket 开始与多家科技公司进行协商,以每张照片 5 美分到 1 美元之间的价格,以及每部影片超过 1 美元的价格,来授权网站上 130 亿份照片和影片用於训练 AI 模型上。
核稿编辑:Chris
快加入 INSIDE Google News 按下追踪,给你最新、最 IN 的科技新闻!