免费教程|10分钟克隆自己,数字人实践教程!

点击上方蓝字关注我们

 

在科技飞速发展的今天,数字世界正以前所未有的速度与现实世界融合,而数字人的出现无疑成为了这场数字革命中的明星。想象一下,有一个与你相似或完全个性化的虚拟形象,不仅能够代表你在虚拟空间中互动,还能执行一系列任务,从简单的娱乐交流到复杂的商业演示,这一切都变得触手可及。数字人,作为AI技术与3D建模的结晶,正在改变我们对自我表达和虚拟体验的认知。

 

一、什么是数字人

数字人,顾名思义,是指通过先进的计算机技术、人工智能、图形渲染等高科技手段创造出的高度逼真的虚拟人物。它们不仅仅是像素的堆砌,而是融合了深度学习、动作捕捉、语音合成等前沿技术,能够模拟人类的外貌、表情、动作乃至情感交流的智能体。数字人的出现,为娱乐、教育、时尚、营销等多个领域带来了前所未有的变革与机遇。比如下面这两个视频中的人物,你能看出数字人和真人的区别吗

 

二、如何免费制作数字人

 

目前常见的数字人工具比如国外的heygen,synthesia, 国内的腾讯智影、闪剪、剪映、万兴播爆等。但是大部分这些工具最后都是需要付费使用的,费用一般是按分钟计费,一般是几元到几十元一分钟不等。

 

如果我们比较在意费用,只是简单尝试一下数字人的效果,本篇文章将会介绍一种方案,只需几块钱、无需编程、无需视频制作技能就简单快速地制作出一个属于自己的数字人视频。

 

我们的方案主要包含以下三个步骤:
1、创建文案。自己撰写文案或通过文心一言、通义千问等工具生成文案,输入文字,得到数字人播出的文案。

 

2、生成数字人视频和语音。通过免费的腾讯智影,生成数字人视频和播放语音。

 

3、AI换脸。通过AI工具,将你指定的脸换到数字人上,形成专属于你的数字人。

三、创建文案

首先,我们要准备一段视频中播放的文字内容,可以是课程讲解、产品介绍等任何你希望数字人播报的内容,下面我们就以奇迹创客的C++课程讲解为例试验一下,该段文字来自奇点信息学人才培养基地:

 

 

 

我准备的文案大约有450字,最终生成的视频时长约为1分半。当然了,我们使用文心一言、通义千问等AI工具也可以生成类似文案,但生成文案并非数字人的重点,这里不再赘述。

 

对于C++中的函数、递归、结构体这三个概念,老师简单描述一下。

 

函数本质上就是一个封装好的功能模块,给函数一个输入、函数用封装的功能来处理输入得到输出、最后再将输出返回。

 

函数在数学、物理、信息学等理工科都用得上,而且初高中数学题很多也是函数。

 

其实日常生活中的很多事物都可以理解为函数啊,比如咱们在手机键盘上输入一个汉字、然后手机做处理、最后将输入的汉字显示在屏幕上,这其实也是一种广义上的函数。

 

递归问题是函数自己调用自己,其中最核心的就是要找到大问题和小问题的关系,将大问题的参数传给下一层的小问题,保证大小问题的逻辑是一样的,最终实现函数自己调用自己。

 

递归还有很重要的一点,就是截止条件,到了最小的问题时需要截止,将结果返回给上一层的大问题,再一步步返回给最上层的大问题,最终解决最大的问题。

 

结构体其实不难,只是一个新的概念,可以理解为我们需要定义一些自己的变量类型,这个类型不是C++默认的数据类型。

 

比如一个人就可以理解为结构体,有自己的属性(身高、体重、年龄等),有自己的功能(跑、跳、说话等),属性就对应C++中的变量,功能就对应C++中的函数。

 

四、腾讯智影生成标准数字人

腾讯智影是腾讯公司推出的一款云端智能视频创作工具,是一款集视频剪辑、素材库、文本配音、数字人播报、字幕识别等功能于一体的智能视频创作工具。它通过强大的AI创作能力,为用户提供了丰富而高效的视频创作体验。

 

对于数字人播报,腾讯智影提供了多种数字人模型,这些虚拟人物具有逼真的外观和流畅的动作,可用于直播、播报新闻、教学讲解等场景。我们输入文本并选择形象后,可快速生成数字人播报视频,支持多种风格的人物形象和背景自定义,适用于新闻播报、教学课件制作等场景。

 

至于为什么选择腾讯智影作为数字人生成的工具,其实原因很简单,因为其数字人功能基本可以做到免费。数字人相关功能,在绝大多数平台都需要收费,甚至想定一个专属自己的数字人,需要几千上万的成本。

 

而腾讯智影属于Tencent旗下的产品,我们可以很方便地在“智影”小程序上每日签到和分享作品来获取免费的数字人生成额度(一分钟足矣),还可以邀请朋友和新注册账号(微信和QQ即可登录腾讯智影)来获取免费额度,毕竟我们周边的朋友应该都有微信或者QQ吧,哈哈!

 

            

那么下面就来演示用腾讯智影来做数字人的详细流程了。

 

1、注册并登录腾讯智影Web端,https://zenvideo.qq.com/。

 

这里需要注意的是,我们使用“智影”小程序是无法做数字人的,必须是PC端登录网页才可以。

 

2、点击数字人播报的功能

 

3、选择横竖版和画面的比例

这里我们选择横版16:9作为演示。

 

4、添加文案

将准备好的文案粘贴到右侧的文本框内,腾讯智影也自带AI文字创作,支持改写、扩写、缩写等。

 

5、选择或定制音色

在文案的下方,我们可以选择数字人的音色和语速,腾讯智影自带多种风格的音色,可适配新闻播报、游戏动漫等各类场景。

此外,我们还可以点击界面的最下方,上传一段自己的录音,定制自己的专属音色呢!

 

6、字幕设置

 

如果你希望在生成的视频中添加字幕,则可以点击右上角的“字幕样式”,设置字幕的大小、字体即可。字幕添加完成后,还可以拖动字幕来调整位置。

 

不需要字幕的话,点击右下角的开关,即可关掉字幕。

 

7、保存并生成播报

点击右下角的“保存并生成播报”,即可生成音频。

 

8、添加数字人

接下来就是我们的重头戏了,将腾讯智影自带的模板数字人添加至视频中。目前免费的模板约20个,足够我们日常使用,如果需要其他模板,就需要充值VIP或专门花钱购买了。

 

9、预览和编辑数字人

等待10-30秒,标准模板的数字人就添加完成了。我们可以在这个界面对数字人进行简单的处理,比如放大、变换位置、旋转、亮度等,甚至可以换服装。

 

10、设置背景图案

左侧选择背景图片,也可以上传一张自己的图片,实现自定义背景。

 

11、合成视频

右上角点击“合成视频”,并对视频参数进行设置,比如清晰度、格式、帧率等,点击确定后开始合成,预计耗时3-5分钟,最终生成的视频存在在我的资源模块中。

 

在这一步中,会消耗我们的数字人功能的额度,如果是腾讯智影VIP用户,则每个月有60分钟的额度。

腾讯智影的普通用户,每个月有5分钟的数字人生成额度,高级会员20分钟/月,专业会员60分钟每月,但这些会员每个月要好几十块钱,不适合我们这种不想花钱的用户。

 

其实没有特别多需求的情况下,普通用户的5分钟/月的额度也足够了,万一额度不足了,也有其他版本。我们可以专门购买数字人加油包,这时就可以用每天签到、分享作品、邀请好友得到的金币来抵扣了。

 

如下图所示,5分钟的数字人生成额度,抵扣后一分钱不花,这就是所谓的完全免费,哈哈!

20240914152549342

12、视频导出

 

生成完的视频存储在我的资源模块中,点击视频右上角的下载符号,就可以将我们生成的数字人视频导出到本地电脑啦!

 

20240914152552481

我们来看看生成的数字人的效果吧!

五、数字人换脸

接下来就是对标准模板中的数字人进行换脸了,我们可以将自己的照片替换上去,就得到了专属于自己的数字人。

 

目前市面上AI换脸的工具有很多,比如faceswap、Reface.ai、海艺、艺术大师等,但这些工具也一样要收费,而且有的不支持视频换脸。作为一名懂技术的程序猿,小编自然要找一些低成本的开源方案了啊,下面就是本篇文章的换脸方案:facefusion。

 

1、部署运行环境-GPU服务器

 

 

想在自己的电脑上运行该换脸软件,需要python环境以及视频解码器等多个依赖,还需要一定的编程知识。而且其计算的速度比较依赖GPU,如果我们没有GPU或者GPU显存较小,那么执行的速度将会非常缓慢,因此我们建议使用云服务来部署该软件。

 

我们使用的云服务商是AutoDL,该平台可为我们提供大模型的运行环境和计算能力,其GPU服务器价格相对较低,支持关机不计费、克隆实例等功能。使用体验良好,有算法社区、镜像、私有化等多种服务。

 

我们注册并登录https://www.autodl.com/,点击上方的“算力市场”进入服务器列表页,选择“按量计费”,在服务器列表页选择一台合适的机器,比如24GB的RTX 3090。

 

我们可以看到,该服务器的费用是1.58元/小时。不过无需担心,我们只用5分钟就可以完成换脸功能啦,不会花费太多。

 

20240914152556146

2、部署运行环境-镜像

 

选定好服务器的下一步是部署镜像。对于初学者来讲,可能不理解什么是镜像,下面给大家进行简要介绍。

 

大家简单想象一下,你正在厨房里准备做一道复杂的菜肴,这道菜需要特定的配料和烹饪工具。你不能假设每个人家里都有同样的食材和厨具,因此你可能会打包一个包含所有必需物品的盒子,以便别人可以在他们的厨房里做出相同的菜肴,而不需要寻找或购买任何额外的东西。

 

在计算机科学中,特别是人工智能领域,这个“盒子”就被称为镜像。镜像包含了运行一个应用程序(比说是大模型)所需的所有组件,包括:操作系统的基础层、必要的软件包和库、编译器和解释器、大模型的代码和数据、运行时环境的配置等等。

 

既然如此,我们就可以将AI换脸的软件包装为镜像,需要做换脸时直接使用该镜像即可,AutoDL这个平台就为我们提供了常用的镜像,比如本次换脸要使用的facefusion2.5.3镜像。

 

首先要在AutoDL首页的上方,点击“算法社区”进入CodeWithGPU论坛,搜索框里搜索facefusion,在搜索结果里选择红框的这个镜像即可,小编已实际部署过该镜像,可正常使用。

20240914152600241

 

点击该镜像,进入镜像的详情页面,右侧点击“AutoDL创建实例”。

20240914152603807

进入实例选择页面后,我们可以看到加载了该镜像的服务器列表页,选择一台RTX 3090服务器,右下角点击“立即创建”即可。

20240914152606471

最后在控制台的容器实例页面,我们就可以看到自己部署的AI服务器和AI环境了。

20240914152609704

3、启动换脸软件

 

接下来,我们要在服务器上启动我们的facefusion换脸软件。在容器实例页面右侧的快捷工具中,找到JupyterLab这个按钮,点击后进入JupyterLab页面。

 

该工具为用户提供执行了Python程序的终端,而facefusion就是一段Python程序,我们需要通过终端来启动 facefusion,这是本篇文章中唯一需要些技术能力的地方,但参照本文的步骤一步步操作的话,难度也不大。

20240914152612433

 

点击左上角的终端1选项卡,进入服务器命令行窗口。在这个窗口中输入命令:cd facefusion,按下回车键。

 

再执行bash run.sh,按下回车键,无报错即代表facefusion软件启动成功。

20240914152615145

 

启动成功后,我们回到容器实例页面,点击右侧快捷工具的“自定义服务”,然后选择Linux/Mac选项,查看连接密码。

 

20240914152617899

20240914152620527

20240914152623932

 

4、使用facefusion换脸

 

点击http://localhost:6006/这个地址后,我们就可以在浏览器中使用facefusion了,下图就是facefusion的初始页面,我们可以上传自己想换的脸、被换的图片或视频、设置换脸参数等等,该工具功能很多,这里我们只演示最简单的上传想换脸的图片和上传被换脸的视频,有兴趣的同学可以试一下其他功能哦。

20240914152627847

完成上传后,我们可以在右上角预览,并在最下方的OUTPUT框内点击START,就可以进行换脸了。执行完成后,就可以在OUTPUT框内看到换脸后的视频,可以将视频导出至自己的电脑上。

20240914152631645

 

为了保障隐私,我们在下面的图片中没有展示要换脸的图片,下面这个视频就是我们换脸后得到的视频了,可以看出效果还是不错的。

 

六、总结

到这步为止,我们这套免费定制数字人的方案就完成了。如果对该流程较为熟练,10分钟左右就做出一个属于自己的数字人视频哦。

整个流程中,唯一需要花钱的地方就是租用AutoDL的AI服务器了。有一点要记住,换脸完成并导出视频后,记得在容器实例页面关机,否则会一直计费的。如果按本文流程走完全流程并立刻关机,大约只需要花费5-8毛钱就够了。

 

20240914152635291

当然了,只要有一张某人的肖像照片,我们就能使用facefusion工具将数字人换成这个人的脸,但是不建议这么做哦(有法律风险),还是做自己的数字人吧!

 

此外,该数字人的口型和语音可能有不一致的地方,想解决该问题的话,可以使用MuseTalk工具,该工具开源免费且效果很好,后续有机会再讲解该工具的使用方法。

 

好啦,本篇文章到此结束,看到如此简单还基本免费的数字人方案,你有没有兴趣尝试一下呢?

 

 

 

20240914152637424

20240914152639281
往期文章推荐

 

 

20240914152640803

20240914152642638

 

 

 

 

 

 

 

阅读剩余
THE END