亮点
多语言创作与互动
支持以 120+ 种语言进行视频创作与实时互动。
清晰的输出限制与格式
视频以 MP4 格式生成;视频时长限制为 5 分钟(Studio 与 API)。
面向开发者的实时 API
API 包含实时流式动画功能,文档见 docs.d-id.com。
截图

关于 D-ID
D-ID 是一个数字人平台,专注于 AI 生成视频与互动式、面对面的虚拟形象体验。从官网来看,产品矩阵包括 Creative Reality™ Studio(Video Studio)、Visual AI Agents、AI Avatars、Video Translate、Video Campaigns、移动端 App 以及 API。
在 Creative Reality™ Studio 中,你可以基于脚本生成虚拟形象视频,也可以从 brief、演示文稿(deck)或文档生成,并以 MP4 输出。网站 FAQ 标注了关键限制与格式:视频以 MP4 生成,视频时长限制为 5 分钟(Studio 与 API),图片上传限制为 10 MB,支持的图片格式包括 JPEG/JPG/PNG。D-ID 还说明了多语言支持(120+ 种语言)以及品牌控制项,例如虚拟形象风格/声音与背景/版式/媒体。
在互动体验方面,D-ID 将 Visual AI Agents 定位为可嵌入的实时对话式虚拟形象,可在各类数字触点中使用。对于开发者,D-ID 提供其 API 的入门文档,其中包含实时流式动画能力。
- 基于脚本、brief、演示文稿(deck)或文档创建多语言虚拟形象视频
- 构建并嵌入实时对话式虚拟形象代理
- 使用 API 进行离线视频生成或实时流式动画
- 将生成的视频导出为 MP4(最长 5 分钟)
功能
Creative Reality™ Studio(Video Studio)
基于脚本生成虚拟形象视频,也可从 brief、演示文稿(deck)或文档生成。
Visual AI Agents
部署用于面对面互动并可嵌入数字触点的实时对话式虚拟形象。
从图片或视频生成 AI 虚拟形象
从图片或视频创建逼真的数字人,用于离线视频与实时体验;网站提到支持声音克隆与多语言输出。
API 与文档
面向开发者的 API,提供文档与实时流式动画能力(docs.d-id.com)。
MP4 输出
所有生成的视频均以 MP4 格式产出(据 FAQ)。
自定义人脸的上传要求
图片上传限制为 10 MB;支持格式包括 JPEG、JPG 与 PNG(据 FAQ)。
使用场景
培训与内部沟通
当你需要一致的呈现效果与快速更新时,可基于脚本、演示文稿(deck)或文档制作培训视频。
多语言营销视频
为营销活动生成多语言虚拟形象视频,并在不同地区实现本地化传播。
基于虚拟形象的客户支持
发布多语言支持视频,并部署互动式代理实时回答问题。
在应用内嵌入虚拟形象体验
使用 API 将离线虚拟形象视频生成或实时流式动画集成到你的产品中。
适用人群
这个工具适合:
定价
常见问题
优缺点
优点 (4)
- 同时支持预渲染虚拟形象视频与实时对话式虚拟形象
- 明确标注了多语言支持(120+ 种语言)
- 技术约束清晰且有文档说明(MP4 输出、5 分钟时长限制、图片大小与格式)
- 为开发者提供 API 文档,包括实时流式动画
缺点 (2)
- 提供的主页内容未包含实际套餐价格或价格表
- 在 Studio 与 API 中视频时长限制为 5 分钟(据 FAQ)
使用方法
创建账户或开始免费试用
通过 Studio 注册流程开始免费试用并访问创作工具。
选择创建人脸的方式
选择预制虚拟形象、上传人脸图片,或使用 FAQ 中描述的文生图选项生成人像。
提供你的内容
使用脚本制作视频,或按网站所述的 Video Studio 工作流从 brief、演示文稿(deck)或文档生成。
导出视频
将最终输出生成为 MP4(据 FAQ),并将总时长控制在 5 分钟以内。
如果要集成到产品中,使用 API
如需自动化或实时流式动画,请使用 API 并参考 docs.d-id.com 的文档。
使用建议
快速测试先用预制虚拟形象
如果你只是验证脚本与节奏,先选择一个预制虚拟形象,然后在内容定稿后再切换为上传图片或生成的人像。
围绕 5 分钟限制做规划
FAQ 指出 Studio 与 API 视频限制为 5 分钟,因此可将较长内容拆分为章节并生成多个 MP4。
准备符合上传要求的图片
将源图片控制在 10 MB 以内,并使用 JPEG/JPG/PNG 格式以避免上传问题。



