新闻  |   论坛  |   博客  |   在线研讨会
AI 还原康乾盛世三代皇帝的样貌,简直太太太好玩了!
AI科技大本营 | 2020-10-15 22:18:37    阅读:3568   发布文章

一位 B 站 up 主「Jack Cui」使用 AI 技术,还原了康熙、雍正、乾隆的历史样貌。

10.gif

看看富态的雍正!!

9.jpg

算法实现

人工智能技术,可以实现很多有趣而又有意义的事情。 

利用 StyleGAN 算法,可以生成逼真的但不存在于这个世界的人物肖像。

8.jpg

甚至可以根据的要求,生成各式各样的人脸,比如网红脸、明星脸、超模脸、萌娃脸、黄种人脸、混血人脸、港式美人脸、日式美人脸。

7.gif

想要在线体验,可以登录下方的这个网站,你每刷新一次页面,网站都会为你随机生成一个不带重样的人物肖像。

https://thispersondoesnotexist.com/

利用风格迁移算法,可以将照片的风格进行转换,照片秒变油画:

6.jpg

秒变漫画:

5.jpg

利用一阶运动模型算法,甚至可以让照片里的人物“复活”,为你演唱一首歌曲。

该算法使用的是 First Order Motion,也就是一阶运动模型,来自 NeurIPS 2019 论文。

「First Order Motion Model for Image Animation」

论文最初的目的是让「静态图片」动起来。如下图所示:“你动,它也动”。

4.gif

这个模型可以轻易地让「权利的游戏」中的人物模仿特朗普进行讲话,还可以让静态的马跑起来等。

3.gif

一阶运动模型的思想是用一组自学习的关键点和局部仿射变换来建立复杂运动模型。

模型由运动估计模块和图像生成模块两个主要部分组成。

2.jpg

首先进行关键点检测,然后根据关键点,进行运动估计,最后使用图像生成模块,生成最终效果。

在运动估计模块中,该模型通过自监督学习将目标物体的外观和运动信息进行分离,并进行特征表示。

而在图像生成模块中,模型会对目标运动期间出现的遮挡进行建模,然后从给定的图片中提取外观信息,结合先前获得的特征表示,生成图片。

作者使用该算法在四个数据集上进行了训练和测试。

VoxCeleb 数据集、UvA-Nemo 数据集、The BAIR robot pushing dataset、作者自己收集的数据集。

其中,VoxCeleb 是一个大型人声识别数据集。

它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音,同时数据基本上是性别平衡的(男性占 55%),这些名人有不同的口音、职业和年龄。

1.jpg

First Order Motion 利用了这个数据集的视频图像,进行了模型训练。

AI修复视频

UP 主就是通过使用这些 AI 技术,复原了康熙、雍正、乾隆的历史样貌。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客