据报道,OpenAI 已使用 YouTube 视频训练 ChatGPT,以获得迄今为止最好的语言模型

据报道,OpenAI 已使用 YouTube 视频训练 ChatGPT,以获得迄今为止最好的语言模型缩略图

OpenAI 长久以来一直采用一些秘而不宣的方法来训练其ChatGPT,关于其语言模型的训练方式鲜少对外公开。然而,近期他们似乎在文案方面遭遇了难题,因为有报道揭示GPT-4是通过数百万小时的YouTube视频进行训练的。

据《纽约时报》披露,OpenAI 一直在利用海量的YouTube视频资源来锤炼其ChatGPT-4模型。大量的音频和视频数据被用作ChatGPT的训练素材。OpenAI 相信,这种做法已经催生出了迄今为止最先进的模型,但同时也引发了一个棘手的问题:YouTube明确禁止未经授权的抓取或下载行为,而GPT-4显然违背了这一规定。

OpenAI 可能因GPT-4未经授权使用YouTube视频训练语言模型而陷入法律困境

目前,YouTube是否会对此采取法律行动尚不明朗。但值得注意的是,这并非ChatGPT首次遭遇版权法问题。《纽约时报》本身就曾对OpenAI和微软提起诉讼,指控它们未经许可就从《纽约时报》获取内容用于训练语言模型。

在法律层面,这确实是一个充满争议的灰色地带。OpenAI一直对其语言模型的训练细节秘而不宣,这可能意味着在合理使用的辩护上缺乏明确的文案支持,但同时也可能为OpenAI和微软提供了一定的法律豁免空间。目前,我们只能静观YouTube将如何应对这一潜在的侵权行为。

即便存在版权争议,GPT-4依然可能是迄今为止最为惊艳的语言模型之一。ChatGPT在人工智能领域取得了长足的进步,它不仅是历史上增长最快的消费者软件应用程序之一,还被广泛应用于从撰写论文到进行完整对话等多种场景。尽管其合法性有待商榷,但我们仍然对GPT-4所能带来的变革充满期待。

滚动至顶部