OpenAI 以其最新的文本到视频生成人工智能模型 Sora 震惊了世界,该模型可以生成逼真的视频。该公司首席技术官 (CTO) Mira Murati 在接受采访时确认,Sora 将在“今年”向公众开放,“可能需要几个月的时间”。
目前,只有有限数量的用户可以访问 Sora,据 OpenAI 首席技术官称,这种情况很快就会改变。
Murati 还确认 Sora “最终”将整合音频生成功能,让用户能够直接从 AI 机器人生成更具吸引力的内容。该报告还强调,该公司正在考虑进一步改进该工具,甚至可能允许用户编辑人工智能生成的视频。
据证实,就计算能力而言,生成视频“要昂贵得多”,该公司计划对 Sora 进行定价,类似于 OpenAI 的文本到图像生成器 DALL-E,后者过去的 115 个积分的售价为 $15。第一个月最初 50 个免费积分,随后每月 15 个免费积分。 OpenAI 目前提供DALL-E 3 访问ChatGPT Plus 订户,每月费用为 $20。
当被问及用于训练模型的数据时,首席技术官表示,“我不会详细介绍所使用的数据,但它是公开可用或许可的数据。”她还证实 OpenAI 使用了其合作伙伴 Shutterstock 的数据。使用 Sora 生成的视频底部会有水印,这有助于用户区分人工生成的内容和人工智能生成的内容。一些国家已经开始实施强有力的法律来防止错误信息的传播,其中包括限制对Gemini AI 进行与选举相关的查询等。
来源:indianexpress 封面:sora