客服热线:+86-13305816468

在线联系:

客服热线:+86-13305816468

在线联系:

 hjc888黄金城官方网站 > ai资讯 > > 正文

Meta AI训练数据黑幕曝光:81.7TB盗版数据引发业界​

2025-02-21 14:54

  随着科技的飞速发展,人工智能(AI)已成为当今世界最具潜力的技术之一。然而,最近科技媒体Ars Technica的报道揭示了Meta公司在AI模型训练数据来源上的一个黑幕,引发了业界的震动。

  首先,让我们回顾一下事件的背景。科技媒体Ars Technica在今天发布博文,报道Meta公司因其AI模型训练数据来源而陷入法律纠纷。原告披露的一份电子邮件证据显示,Meta不仅知晓使用LibGen数据库进行AI训练涉及盗版行为,而且还试图掩盖其通过种子下载(torrenting)方式,获取至少81.7TB数据的行为,甚至采取了“隐身模式”操作。

  在Meta公司研究员Frank Zhang的内部邮件中,我们看到了Meta为防止任何人追踪到下载源,在下载数据集时特意避免使用Facebook服务器,并称这种操作为“隐身模式”。这无疑暴露了Meta在数据获取过程中的不端行为,以及其对法律责任的漠视。

  负责项目管理的Meta高管迈克尔·克拉克(Michael Clark)在证词中表示,Meta修改了设置,以尽可能减少种子传播。然而,这并不能掩盖其最初的行为。未经编辑的邮件显示,使用LibGen的决定是在“此前上报给MZ(马克·扎克伯格)”之后做出的,这与扎克伯格此前声称对使用LibGen不知情的证词相矛盾。这一矛盾不仅损害了Meta的声誉,也对其辩护策略构成了挑战。

  值得注意的是,原告认为这些新证据与Meta之前的证词相矛盾,要求再次传唤涉事员工作证。这一要求是合理的,因为新证据可能会改变案件的走向。而Meta公司坚称使用LibGen进行AI训练属于“合理使用”,但新的证据无疑使其处境更加复杂。

  回顾整个事件,我们不禁要问:Meta公司为何要采取如此不道德和违法的行为?是为了追求利益还是对技术的盲目追求?事实上,这已经不是Meta第一次因数据问题陷入争议。此前,该公司也因用户数据隐私和安全问题备受质疑。这不禁让我们思考,科技公司在追求技术进步的同时,是否也应该重视其行为对整个行业和社会的影响?

  对于业界来说,这次事件无疑引发了一场震动。一方面,它提醒我们加强数据监管,保护知识产权;另一方面,它也促使我们重新审视AI技术的发展方向和伦理问题。毕竟,一个健康的科技生态系统需要所有参与者共同维护,包括科技公司、监管机构、行业协会以及广大消费者。

  总的来说,Meta的这次黑幕事件引发了业界的震动,让我们再次关注到科技公司行为对整个行业和社会的影响。作为消费者和监管机构,我们需要密切关注此事的发展,并加强数据监管和知识产权保护,以确保科技行业的健康和可持续发展。




上一篇:OpenAI德国新布局:如何扩大其在欧盟影响力,挑 下一篇:谷歌放弃不开发武器AI承诺引争议:前高管吴恩达
 -->