免费教程｜10分钟克隆自己，数字人实践教程！

2024-9-7

点击上方蓝字关注我们

在科技飞速发展的今天，数字世界正以前所未有的速度与现实世界融合，而数字人的出现无疑成为了这场数字革命中的明星。想象一下，有一个与你相似或完全个性化的虚拟形象，不仅能够代表你在虚拟空间中互动，还能执行一系列任务，从简单的娱乐交流到复杂的商业演示，这一切都变得触手可及。数字人，作为AI技术与3D建模的结晶，正在改变我们对自我表达和虚拟体验的认知。

一、什么是数字人

数字人，顾名思义，是指通过先进的计算机技术、人工智能、图形渲染等高科技手段创造出的高度逼真的虚拟人物。它们不仅仅是像素的堆砌，而是融合了深度学习、动作捕捉、语音合成等前沿技术，能够模拟人类的外貌、表情、动作乃至情感交流的智能体。数字人的出现，为娱乐、教育、时尚、营销等多个领域带来了前所未有的变革与机遇。比如下面这两个视频中的人物，你能看出数字人和真人的区别吗？

二、如何免费制作数字人

目前常见的数字人工具比如国外的heygen,synthesia, 国内的腾讯智影、闪剪、剪映、万兴播爆等。但是大部分这些工具最后都是需要付费使用的，费用一般是按分钟计费，一般是几元到几十元一分钟不等。

如果我们比较在意费用，只是简单尝试一下数字人的效果，本篇文章将会介绍一种方案，只需几块钱、无需编程、无需视频制作技能就简单快速地制作出一个属于自己的数字人视频。

我们的方案主要包含以下三个步骤：

1、创建文案。自己撰写文案或通过文心一言、通义千问等工具生成文案，输入文字，得到数字人播出的文案。

2、生成数字人视频和语音。通过免费的腾讯智影，生成数字人视频和播放语音。

3、AI换脸。通过AI工具，将你指定的脸换到数字人上，形成专属于你的数字人。

三、创建文案

首先，我们要准备一段视频中播放的文字内容，可以是课程讲解、产品介绍等任何你希望数字人播报的内容，下面我们就以奇迹创客的C++课程讲解为例试验一下，该段文字来自奇点信息学人才培养基地：

我准备的文案大约有450字，最终生成的视频时长约为1分半。当然了，我们使用文心一言、通义千问等AI工具也可以生成类似文案，但生成文案并非数字人的重点，这里不再赘述。

对于C++中的函数、递归、结构体这三个概念，老师简单描述一下。

函数本质上就是一个封装好的功能模块，给函数一个输入、函数用封装的功能来处理输入得到输出、最后再将输出返回。

函数在数学、物理、信息学等理工科都用得上，而且初高中数学题很多也是函数。

其实日常生活中的很多事物都可以理解为函数啊，比如咱们在手机键盘上输入一个汉字、然后手机做处理、最后将输入的汉字显示在屏幕上，这其实也是一种广义上的函数。

递归问题是函数自己调用自己，其中最核心的就是要找到大问题和小问题的关系，将大问题的参数传给下一层的小问题，保证大小问题的逻辑是一样的，最终实现函数自己调用自己。

递归还有很重要的一点，就是截止条件，到了最小的问题时需要截止，将结果返回给上一层的大问题，再一步步返回给最上层的大问题，最终解决最大的问题。

结构体其实不难，只是一个新的概念，可以理解为我们需要定义一些自己的变量类型，这个类型不是C++默认的数据类型。

比如一个人就可以理解为结构体，有自己的属性（身高、体重、年龄等），有自己的功能（跑、跳、说话等），属性就对应C++中的变量，功能就对应C++中的函数。

四、腾讯智影生成标准数字人

腾讯智影是腾讯公司推出的一款云端智能视频创作工具，是一款集视频剪辑、素材库、文本配音、数字人播报、字幕识别等功能于一体的智能视频创作工具。它通过强大的AI创作能力，为用户提供了丰富而高效的视频创作体验。

对于数字人播报，腾讯智影提供了多种数字人模型，这些虚拟人物具有逼真的外观和流畅的动作，可用于直播、播报新闻、教学讲解等场景。我们输入文本并选择形象后，可快速生成数字人播报视频，支持多种风格的人物形象和背景自定义，适用于新闻播报、教学课件制作等场景。

至于为什么选择腾讯智影作为数字人生成的工具，其实原因很简单，因为其数字人功能基本可以做到免费。数字人相关功能，在绝大多数平台都需要收费，甚至想定一个专属自己的数字人，需要几千上万的成本。

而腾讯智影属于Tencent旗下的产品，我们可以很方便地在“智影”小程序上每日签到和分享作品来获取免费的数字人生成额度（一分钟足矣），还可以邀请朋友和新注册账号（微信和QQ即可登录腾讯智影）来获取免费额度，毕竟我们周边的朋友应该都有微信或者QQ吧，哈哈！

那么下面就来演示用腾讯智影来做数字人的详细流程了。

1、注册并登录腾讯智影Web端，https://zenvideo.qq.com/。

这里需要注意的是，我们使用“智影”小程序是无法做数字人的，必须是PC端登录网页才可以。

2、点击数字人播报的功能

3、选择横竖版和画面的比例

这里我们选择横版16:9作为演示。

4、添加文案

将准备好的文案粘贴到右侧的文本框内，腾讯智影也自带AI文字创作，支持改写、扩写、缩写等。

5、选择或定制音色

在文案的下方，我们可以选择数字人的音色和语速，腾讯智影自带多种风格的音色，可适配新闻播报、游戏动漫等各类场景。

此外，我们还可以点击界面的最下方，上传一段自己的录音，定制自己的专属音色呢！

6、字幕设置

如果你希望在生成的视频中添加字幕，则可以点击右上角的“字幕样式”，设置字幕的大小、字体即可。字幕添加完成后，还可以拖动字幕来调整位置。

不需要字幕的话，点击右下角的开关，即可关掉字幕。

7、保存并生成播报

点击右下角的“保存并生成播报”，即可生成音频。

8、添加数字人

接下来就是我们的重头戏了，将腾讯智影自带的模板数字人添加至视频中。目前免费的模板约20个，足够我们日常使用，如果需要其他模板，就需要充值VIP或专门花钱购买了。

9、预览和编辑数字人

等待10-30秒，标准模板的数字人就添加完成了。我们可以在这个界面对数字人进行简单的处理，比如放大、变换位置、旋转、亮度等，甚至可以换服装。

10、设置背景图案

左侧选择背景图片，也可以上传一张自己的图片，实现自定义背景。

11、合成视频

右上角点击“合成视频”，并对视频参数进行设置，比如清晰度、格式、帧率等，点击确定后开始合成，预计耗时3-5分钟，最终生成的视频存在在我的资源模块中。

在这一步中，会消耗我们的数字人功能的额度，如果是腾讯智影VIP用户，则每个月有60分钟的额度。

腾讯智影的普通用户，每个月有5分钟的数字人生成额度，高级会员20分钟/月，专业会员60分钟每月，但这些会员每个月要好几十块钱，不适合我们这种不想花钱的用户。

其实没有特别多需求的情况下，普通用户的5分钟/月的额度也足够了，万一额度不足了，也有其他版本。我们可以专门购买数字人加油包，这时就可以用每天签到、分享作品、邀请好友得到的金币来抵扣了。

如下图所示，5分钟的数字人生成额度，抵扣后一分钱不花，这就是所谓的完全免费，哈哈！

20240914152549342

12、视频导出

生成完的视频存储在我的资源模块中，点击视频右上角的下载符号，就可以将我们生成的数字人视频导出到本地电脑啦！

20240914152552481

我们来看看生成的数字人的效果吧！

五、数字人换脸

接下来就是对标准模板中的数字人进行换脸了，我们可以将自己的照片替换上去，就得到了专属于自己的数字人。

目前市面上AI换脸的工具有很多，比如faceswap、Reface.ai、海艺、艺术大师等，但这些工具也一样要收费，而且有的不支持视频换脸。作为一名懂技术的程序猿，小编自然要找一些低成本的开源方案了啊，下面就是本篇文章的换脸方案：facefusion。

1、部署运行环境-GPU服务器

想在自己的电脑上运行该换脸软件，需要python环境以及视频解码器等多个依赖，还需要一定的编程知识。而且其计算的速度比较依赖GPU，如果我们没有GPU或者GPU显存较小，那么执行的速度将会非常缓慢，因此我们建议使用云服务来部署该软件。

我们使用的云服务商是AutoDL，该平台可为我们提供大模型的运行环境和计算能力，其GPU服务器价格相对较低，支持关机不计费、克隆实例等功能。使用体验良好，有算法社区、镜像、私有化等多种服务。

我们注册并登录https://www.autodl.com/，点击上方的“算力市场”进入服务器列表页，选择“按量计费”，在服务器列表页选择一台合适的机器，比如24GB的RTX 3090。

我们可以看到，该服务器的费用是1.58元/小时。不过无需担心，我们只用5分钟就可以完成换脸功能啦，不会花费太多。

20240914152556146

2、部署运行环境-镜像

选定好服务器的下一步是部署镜像。对于初学者来讲，可能不理解什么是镜像，下面给大家进行简要介绍。

大家简单想象一下，你正在厨房里准备做一道复杂的菜肴，这道菜需要特定的配料和烹饪工具。你不能假设每个人家里都有同样的食材和厨具，因此你可能会打包一个包含所有必需物品的盒子，以便别人可以在他们的厨房里做出相同的菜肴，而不需要寻找或购买任何额外的东西。

在计算机科学中，特别是人工智能领域，这个“盒子”就被称为镜像。镜像包含了运行一个应用程序（比说是大模型）所需的所有组件，包括：操作系统的基础层、必要的软件包和库、编译器和解释器、大模型的代码和数据、运行时环境的配置等等。

既然如此，我们就可以将AI换脸的软件包装为镜像，需要做换脸时直接使用该镜像即可，AutoDL这个平台就为我们提供了常用的镜像，比如本次换脸要使用的facefusion2.5.3镜像。

首先要在AutoDL首页的上方，点击“算法社区”进入CodeWithGPU论坛，搜索框里搜索facefusion，在搜索结果里选择红框的这个镜像即可，小编已实际部署过该镜像，可正常使用。

20240914152600241

点击该镜像，进入镜像的详情页面，右侧点击“AutoDL创建实例”。

20240914152603807

进入实例选择页面后，我们可以看到加载了该镜像的服务器列表页，选择一台RTX 3090服务器，右下角点击“立即创建”即可。

20240914152606471

最后在控制台的容器实例页面，我们就可以看到自己部署的AI服务器和AI环境了。

20240914152609704

3、启动换脸软件

接下来，我们要在服务器上启动我们的facefusion换脸软件。在容器实例页面右侧的快捷工具中，找到JupyterLab这个按钮，点击后进入JupyterLab页面。

该工具为用户提供执行了Python程序的终端，而facefusion就是一段Python程序，我们需要通过终端来启动 facefusion，这是本篇文章中唯一需要些技术能力的地方，但参照本文的步骤一步步操作的话，难度也不大。

20240914152612433

点击左上角的终端1选项卡，进入服务器命令行窗口。在这个窗口中输入命令：cd facefusion，按下回车键。

再执行bash run.sh，按下回车键，无报错即代表facefusion软件启动成功。

20240914152615145

启动成功后，我们回到容器实例页面，点击右侧快捷工具的“自定义服务”，然后选择Linux/Mac选项，查看连接密码。

20240914152617899

20240914152620527

20240914152623932

4、使用facefusion换脸

点击http://localhost:6006/这个地址后，我们就可以在浏览器中使用facefusion了，下图就是facefusion的初始页面，我们可以上传自己想换的脸、被换的图片或视频、设置换脸参数等等，该工具功能很多，这里我们只演示最简单的上传想换脸的图片和上传被换脸的视频，有兴趣的同学可以试一下其他功能哦。

20240914152627847