OpenAI

OpenAI

Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。该模型不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。嘛哩嘛哩编辑已经浏览过该网站,目前安全可靠、网站布局整洁、内容丰富、访问速度正常,需要这方面资源可以放心浏览!该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。Sora 还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。目前的模型有弱点。它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。安全在OpenAI的产品中提供Sora之前,我们将采取几个重要的安全措施。我们正在与红队成员合作,他们是错误信息、仇恨内容和偏见等领域的领域专家,他们将对模型进行对抗性测试。我们还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断视频何时由 Sora 生成。我们计划包括C2PA 元数据将来,如果我们在 OpenAI 产品中部署模型。除了开发新技术来准备部署之外,我们还利用现有的安全方法我们为使用 DALL·E 3,也适用于Sora。例如,一旦进入 OpenAI 产品,我们的文本分类器将检查并拒绝违反我们使用政策的文本输入提示,例如那些请求极端暴力、色情内容、仇恨图像、名人肖像或他人 IP 的提示。我们还开发了强大的图像分类器,用于查看生成的每个视频的帧数,以帮助确保在向用户显示视频之前,这些视频符合我们的使用政策。我们将与世界各地的政策制定者、教育工作者和艺术家合作,了解他们的担忧,并确定这项新技术的积极用例。尽管进行了广泛的研究和测试,但我们无法预测人们使用我们技术的所有有益方式,也无法预测人们滥用技术的所有方式。这就是为什么我们认为,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。
03030
Hedra

Hedra

Hedra是斯坦福初创公司发布的视频工具Hedra的官方网站。嘛哩嘛哩编辑已经浏览过该网站,目前安全可靠、网站布局整洁、内容丰富、访问速度正常,需要这方面资源可以放心浏览!Hedra的基础模型Character-1可以将音频、图像、视频整合进同一工作流,支持根据任意人物照片和语音内容生成具有表现力和可控性的人类角色视频,允许用户上传照片和语音,实现人物说话或唱歌的效果,并保持唇形、表情和姿态与语音内容相匹配。该工具目前可在桌面和移动设备上使用,在音频部分预置了6种音色,既可以文字转音频,也支持上传音频文件。用户输入角色描述后可直接生成图像,也能上传图像,然后一键生成视频。目前其开放预览版支持生成30秒逼真视频。Hedra的特点和功能包括:无限时长(目前开放预览版为30秒);每60秒生成90秒(如果官方H100供应充足);模型目前提供音频到视频,但正在扩展其他输入形式;即将推出16:9的视频尺寸;模型主要测试了中文和英文输入,且中文表现不错;目前提供 API,可加入官方 Discord。其团队成员包括首席执行官 Michael Lingelbach(斯坦福大学前博士生,从事空间智能研究),以及负责人 Alex Bergman(同样来自斯坦福大学,研究领域包括计算成像、计算机视觉、计算机图形学和机器学习)。
03000