超17万个视频!英伟达苹果等巨头被曝违规用数据训练AI
2024-07-17 18:21:45
来源:快科技
0
7月17日消息,据媒体报道,包括NVIDIA、苹果、Salesforce和Anthropic在内的多家科技巨头,被曝光涉嫌违规使用数据,用于训练其AI模型。
这些公司被发现使用了超过173536个YouTube视频的字幕数据,而这些数据的获取并未得到视频创作者的许可。
这些公司所使用的数据集名为“YouTube Subtitles”,由非营利组织EleutherAI创建,该数据集包含了来自超过48000个频道的视频文本。
其中不乏知名教育机构和媒体公司的内容,例如可汗学院、麻省理工学院、哈佛大学等,此外,一些广受欢迎的YouTube创作者,如MrBeast等的视频也被包括在内。
此前,EleutherAI发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括YouTube Subtitles。
不过值得注意的是,苹果在使用Pile数据集训练OpenELM模型时,并未直接下载数据,因此在技术层面上,是EleutherAI违反了YouTube的使用条款。
YouTube明确禁止未经授权从平台获取素材,同时这些数据不仅用于训练AI,还可能涉及到版权和隐私问题。
创作者们也对此表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。
英伟达承认部分RTX 5090/5070 Ti存在缺陷:可以更换
2025-02-24
0
RTX5070Ti跑分竟不及4070Ti 勉强超越RTX4070S
2025-02-24
0
黄仁勋:市场对DeepSeek的理解完全搞反了
2025-02-22
0
RTX 5090再曝硬件问题:光栅单元竟然缩水
2025-02-22
0
手游推荐

皇者-0.1折GM刷充版
经典传奇,皇者回归
经典传奇,皇者回归!本游戏承诺所有充值均为0.1折!游戏独创第四职业魔神,上线送万元充值卡登陆就送,更有每日登录领取真充卡,零元党也可以玩的很开心!游戏不但还原了经典的传奇特色,更加入了一些创新元素!让您和您的那些兄弟驰骋沙城,称霸全服!
热门评论
全部评论
还没有评论,快来抢沙发~