人工智能

共 622 篇网址

Hedra

Hedra是斯坦福初创公司发布的视频工具Hedra的官方网站。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!Hedra的基础模型Character-1可以将音频、图像、视频整合进同一工作流，支持根据任意人物照片和语音内容生成具有表现力和可控性的人类角色视频，允许用户上传照片和语音，实现人物说话或唱歌的效果，并保持唇形、表情和姿态与语音内容相匹配。该工具目前可在桌面和移动设备上使用，在音频部分预置了6种音色，既可以文字转音频，也支持上传音频文件。用户输入角色描述后可直接生成图像，也能上传图像，然后一键生成视频。目前其开放预览版支持生成30秒逼真视频。Hedra的特点和功能包括：无限时长（目前开放预览版为30秒）；每60秒生成90秒（如果官方H100供应充足）；模型目前提供音频到视频，但正在扩展其他输入形式；即将推出16:9的视频尺寸；模型主要测试了中文和英文输入，且中文表现不错；目前提供 API，可加入官方 Discord。其团队成员包括首席执行官 Michael Lingelbach（斯坦福大学前博士生，从事空间智能研究），以及负责人 Alex Bergman（同样来自斯坦福大学，研究领域包括计算成像、计算机视觉、计算机图形学和机器学习）。

03000

人工智能 # 人工智能

Duix

DUIX 是硅基智能开发的 AI 数字人智能交互平台。它具有以下特点和功能：嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!开源免费：开发者可以自由使用和修改平台代码，降低开发成本，进行个性化的数字人创造。功能强大：集成语音识别（ASR）、语音合成（TTS）、大模型、知识库等能力，实现数字人的高度拟人化和实时交互。包括语音输入、语音输出、实时交互和多终端支持等功能，支持高效的语音输入，可识别多种语言和口音；生成自然流畅的语音输出，提升用户交互体验。部署简单：无需专业的技术团队，即使是新手也能轻松上手，支持在 Android 和 iOS 等多终端一键部署，还可部署在多种大屏显示设备上。应用广泛：可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。适用于地铁、银行、政务等多种场景的虚拟助理自助服务，例如提供虚拟助理服务，解答乘客问题、提供出行信息，实现自动化客户服务、智能咨询服务，也可应用于虚拟主持人、虚拟形象等场景，增强互动性和趣味性，提升用户体验，提供精准、快速的服务和支持。

04220

人工智能 # 人工智能

MOKI

“MOKI”可能指的是美图公司推出的 AI 短片创作工具。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!MOKI 构建了从前期设定到 AI 内容生成，再到后期制作的完整 AI 短片工作流，其主要功能包括：AI 短片创作：支持动画短片、网文短剧、故事绘本和 MV 等多种视频类型，并提供创意构思辅助。AI 生成分镜图：可以自动生成分镜图并转换为视频素材。AI 智能剪辑：自动识别视频关键帧，进行智能剪辑，提高视频编辑效率。AI 配乐：提供 AI 配乐功能，能自动为视频添加契合的背景音乐。AI 音效：自动添加环境或特定动作音效，增强真实感。AI 字幕：通过语音识别技术把对话语音自动生成视频字幕，支持多种语言。与常规文生视频产品不同，MOKI 深度理解视频创作者需求，可实现内容和成本的双重可控，目前能够进行多种视频场景的 AI 短片创作。

01950

人工智能 # 人工智能

Vimi

Vimi是由商汤科技精心打造的一款可控人物视频生成AIGC产品，它代表了人工智能在视频生成领域的最新突破。这款产品利用商汤科技的"日日新"大模型，通过先进的AI技术，实现了人物视频的智能生成和高度定制化。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!Vimi的核心优势在于其高度的可控性和灵活性。用户可以通过多种方式控制视频内容，包括动作、动画、声音和文字等。无论是简单的手势、复杂的舞蹈动作，还是个性化的语音和文字表达，Vimi都能够准确识别并生成相应的视频内容。使用Vimi，用户可以轻松地创建与目标动作高度一致的视频。平台的AI算法能够精确捕捉用户输入的动作和声音信息，然后根据这些信息生成流畅、自然的视频。这使得Vimi不仅适用于个人娱乐和创意表达，也非常适合专业领域的应用，如影视制作、广告拍摄和虚拟主播等。Vimi的操作界面简洁直观，用户可以快速上手并进行创作。平台提供了丰富的模板和素材库，用户可以根据自己的需求选择合适的模板进行创作，或者利用素材库中的元素进行个性化的编辑。此外，Vimi在保证视频质量的同时，也注重了生成速度和效率。利用商汤科技的"日日新"大模型，Vimi能够快速处理大量的数据和信息，生成高质量的视频。这大大提高了视频制作的效率，缩短了制作周期。Vimi的应用场景非常广泛。无论是个人创作者、企业宣传还是社交媒体内容制作，Vimi都能够提供强大的支持。它不仅提高了视频制作的效率，也降低了视频创作的门槛，使得更多的人能够参与到视频创作中来。随着人工智能技术的不断发展，Vimi的功能也在不断完善和扩展。未来，我们可以预见，这款产品将更加智能和强大，为用户提供更加丰富和便捷的视频创作体验。无论是专业视频制作人员还是普通用户，Vimi都将是他们创作旅程中的重要伙伴。总的来说，Vimi是一款具有创新意义的可控人物视频生成AIGC产品。它以其先进的技术、高效的功能和用户友好的操作体验，为视频创作领域带来了新的活力。随着越来越多的用户开始使用Vimi，我们有理由相信，它将成为视频创作领域的新标杆，推动人工智能技术在视频生成领域的应用和发展。

02560

人工智能 # 人工智能

即构数智人创作平台

即构数智人创作平台,是一款基于人工智能、形象声音克隆、文本驱动、语音驱动、云计算技术的视频生成平台。您可以通过平台提供的多种工具、功能和服务,轻松制作出拥有本人形象和声音的短视频。用生成式技术赋能短视频制作,降低内容生产门槛。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!即构数智人创作平台是一个能够帮助用户定制数字分身，并生成数智人短视频的平台。使用该平台创作数智人短视频仅需7步：登录平台，创建新项目：登陆数智人短视频平台后，点击“我的项目>制作数智人视频”，创建新项目，进入“项目编辑界面”，这里会有一个包含默认视频比例、默认数智人形象和默认背景的初始分镜。调整视频比例：平台目前支持16:9和9:16两种画面比例，如果初始视频画面比例不符合需求，可进行选择调整。编辑数智人、背景和素材：调整数智人：点击侧边栏的“数智人”按钮，选择人模，其默认形象会出现在画布上；然后在“选择形象”里挑选该数智人的具体形象，也会出现在画布上；接着单击选中画布上的数智人，即可调整其大小、图层或移动位置。编辑背景：平台支持使用在线背景（包括纯色背景和图片背景）和自定义背景。使用在线背景时，点击侧边栏的“背景”即可查看；自定义背景则点击侧边栏的“背景>我的背景”，可选择上传图片或视频作为视频背景。需注意资源的格式、大小和比例限制。使用素材（可选）：平台提供在线素材和自定义素材。使用在线素材时点击侧边栏的“素材”即可查看；自定义素材同样通过点击侧边栏的“素材>我的素材”上传图片或视频。生成分镜音频：布置好当前分镜画面后，可准备音频。在画布右侧，可以选择让数智人根据文本自动生成语音（文本驱动），也可自行传入音频（音频驱动），但需注意文本驱动与音频驱动互斥，不要在制作视频中途切换驱动方式，否则会丢失现有内容。文本驱动：单击“文本驱动”下的分镜台词编辑窗口，在弹窗中输入视频所需文本，点击“试听”可试听生成效果。若对音频不满意，还可自行插入停顿、更换音色、检测读音（以纠正读音）等。调整完成并确认后点击“保存”。音频驱动：若已自备音频素材，可点击“音频驱动>添加分镜音频”上传使用。上传音频后，若需调整，可查看相关帮助。另外，上传音频后如需重新上传，应点击重新上传，而非删除，否则将删除整个分镜（包括视频画面），但删除分镜1的音频时，其画面仍会保留。添加分镜（可选）：若需要更多分镜，可点击“文本驱动/音频驱动”中的“添加分镜音频”，平台将复制当前分镜的数智人和背景作为新的分镜，然后重复上述操作来调整新分镜的数智人模型、背景、素材和音频等。预览视频：当所有分镜调整完毕后，点击顶部的“预览”按钮，可预览完整视频，此时数智人保持静态，但可确认其他元素是否符合预期。合成视频：点击顶部的“合成视频”按钮，可修改输出产品的名称，点击“确定”即可开始合成。之后前往“我的视频”选择生成的视频，根据指引点击下载，即可获取1080P、H.264格式的视频。新注册用户在该平台可享受3分钟免费制作时长。登录平台后，在左侧菜单点击“我的权益”，即可查看可用制作时长及其使用情况和消耗明细等。如果权益不足，可联系客服人员（AIgc@zego.im）购买。即构数智人创作平台具有操作相对简便、能降低成本、提高内容生产效率等特点，可应用于多种场景，为企业提供高效的短视频营销工具、虚拟直播、实时互动型数字人等一站式解决方案。用户只需上传一段本人录制视频，就可以定制自己的专属数智人分身，并能自由进行内容创作或直播，省去了传统内容生产过程中的诸多环节。其数智人还支持定制形象、背景、音色、语言等，并且可自动进行语义理解，模仿真人表情与动作，根据同一段内容每次演绎出不同效果。

02580

人工智能 # 人工智能

如果相机

如果换种生活，自己会是什么样子？如果相机，用 AI帮你看见，各种「如果」背后自己可能的样子。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!

02550

人工智能 # 人工智能

白日梦

光魔科技（深圳）有限公司于2023年成立，我们的愿景是“让人人讲出心中的故事”！我们通过打造AIGC内容创作故事引擎，为创作者提供一个自由表达和实现梦想的平台，以帮助艺术家和创作者释放他们的无限潜能。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!旗下核心产品白日梦AI是一款全新的文生视频类AIGC创作平台。支持功能有：文生视频、动态画面、AI角色生成、人物/场景一致性...更多功能，等你来发现！

08840

人工智能 # 人工智能

达摩院寻光

达摩院寻光视频创作平台，以视觉AIGC为核心功能，用PPT制作的方式创作视频，为用户带来一站式、高可控的AIGC创作体验，让更多用户感受AI创作的魅力。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!

02190

人工智能 # 人工智能

Vidu

Vidu是由生数科技携手清华大学联合发布的创新成果，标志着中国在视频大模型领域迈出了重要一步。作为国内首个具备长时长、高一致性、高动态性特点的视频大模型，Vidu在视频生成技术方面实现了重大突破。Vidu的核心架构是原创的U-ViT(Unified Vision Transformer)，这一架构通过先进的深度学习技术，使得视频生成的质量和效率得到了显著提升。基于U-ViT架构，Vidu能够一键生成长达16秒的视频内容，这些视频不仅在时间上具有连续性，而且在视觉表现上也保持了高度的一致性和动态性。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!1080P分辨率的高清视频输出是Vidu的另一大亮点。用户可以通过Vidu轻松制作出细节丰富、画面清晰的视频作品。无论是商业广告、产品展示还是个人创作，Vidu都能提供高质量的视频生成服务。Vidu的应用场景非常广泛，它不仅可以用于传统的视频制作领域，还可以拓展到虚拟现实、增强现实、游戏开发等新兴领域。Vidu的高动态性特点，使得它能够适应各种复杂的场景和动态变化，为用户提供更加丰富和生动的视频体验。Vidu的操作界面简洁直观，用户可以快速上手并开始视频创作。它提供了丰富的自定义选项，用户可以根据自己的需求调整视频的风格、时长、分辨率等参数。在数据安全和隐私保护方面，Vidu同样重视。它采用了高标准的数据加密和访问控制机制，确保用户在使用过程中的数据安全和隐私。用户可以安心地使用Vidu，无需担心信息泄露或滥用的问题。随着人工智能技术的不断发展，Vidu的功能也在不断完善和扩展。未来，Vidu有望引入更多的智能特性，如自然语言理解、情感分析等，进一步提升视频生成的智能化水平。总体而言，Vidu是一款具有创新意义的视频大模型。它以其长时长、高一致性、高动态性的特点，以及1080P高清视频生成能力，为用户提供了一个高效、便捷的视频创作平台。随着越来越多的用户开始使用Vidu，我们有理由相信，它将成为推动视频制作技术发展和创新的重要力量。

02880

人工智能 # 人工智能

Vozo

Vozo是一款集成了多种先进功能的AI视频编辑工具，它通过人工智能技术的应用，极大地简化了视频制作流程，为用户提供了一种高效、灵活的视频创作解决方案。这款工具的设计理念是让视频编辑变得更加智能化和自动化，从而降低视频制作的技术门槛，提高创作效率。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!Vozo的核心功能之一是一键脚本重写。用户可以通过这个功能快速优化和调整视频脚本，使其更加符合视频内容和风格。这项功能特别适合需要快速迭代和修改视频内容的创作者。自动配音是Vozo的另一项重要功能。它能够根据视频内容自动生成配音，节省了传统配音所需的时间和精力。Vozo的自动配音技术不仅能够提供自然流畅的语言输出，还支持多种语言和声音风格，满足不同视频的需求。文本驱动的语音编辑功能使得用户可以根据文本内容，快速编辑和调整视频中的语音部分。这项功能特别适合需要精确控制语音内容和节奏的视频制作场景。多角色口型同步是Vozo的一项创新功能，它能够自动识别视频中的多个角色，并实现口型与语音的同步。这使得视频中的对话更加自然和逼真，提高了视频的专业度和观赏性。Vozo还提供了专业多语言翻译服务，支持多种语言的翻译和配音，使得视频内容能够跨越语言障碍，触及全球观众。这项服务特别适合需要进行国际传播和多语言版本的视频项目。自动视频优化是Vozo的另一项增值服务，它能够根据视频的内容和风格，自动调整视频的参数和效果，提升视频的质量和观赏性。这项功能特别适合需要快速提升视频质量的创作者。Vozo的操作界面简洁直观，用户可以轻松上手并快速开始使用。它还提供了丰富的自定义选项，用户可以根据自己的需求调整视频的风格、节奏和元素。在数据安全和隐私保护方面，Vozo同样重视。它采用了高标准的数据加密和访问控制机制，确保用户在使用过程中的数据安全和隐私。用户可以安心地使用Vozo，无需担心信息泄露或滥用的问题。随着人工智能技术的不断发展，Vozo的功能也在不断完善和扩展。未来，这款AI视频编辑工具有望引入更多的智能特性，如情感分析、场景识别等，进一步提升用户体验。总体而言，Vozo是一款功能全面、操作简便、安全可靠的AI视频编辑工具。它以其一键脚本重写、自动配音、文本驱动的语音编辑、多角色口型同步、专业多语言翻译和自动视频优化等功能，为用户提供了一个高效、便捷的视频创作平台。随着越来越多的用户开始使用Vozo，我们有理由相信，它将成为推动视频创作技术发展和创新的重要力量。

02430

人工智能 # 人工智能

场辞

场辞是一款基于语音识别技术的视频字幕制作软件，提供语音转字幕、一键加字幕、视频加字幕，字幕快捷校对等功能，最快5min即可完成1小时的视频字幕制作，准确率高达97.5%。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!新片场汇聚全球原创优质视频及创作人，提供4K、无广告、无水印视频观看，专业的视频艺术学习教程，正版视觉素材交易等，与数百万创作人一起用作品打动世界。

02360

人工智能 # 人工智能

LALAL.AI

使用LALAL.AI快速准确地分割人声和器乐曲目。上传任何音频文件，并在几秒钟内接收高质量的提取曲目。嘛哩嘛哩编辑已经浏览过该网站，目前安全可靠、网站布局整洁、内容丰富、访问速度正常，需要这方面资源可以放心浏览!

03830

AI写作 # AI写作