喜欢网购或观看视频直播的90后、00后新近发现,一些直播平台开始实施AI驱动的“数字人”24小时不停播,完全超越人在时空、物理条件的束缚。百度智能云曦灵在杭州举行的新品发布会上,更展示了建模、动捕、服装仿真等领域的技术突破,让偶像级的“数字人”实现秒级生产。
图一:一键秒级生成六大风格的超高精人像。
什么是“数字人”,前不久全国科学技术名词审定委员会专家学者经过深入研讨,形成的共识是运用数字技术创造出来的、与人类形象接近的数字化人物形象,叫“数字人” (digital human,meta human)。最早提出“数字人”研究概念的是1989年美国国立医学图书馆,至今20多年。此前由于一个“数字人”动辄百万元的制作费费,让很多机构与平台望而却步,人们也觉得“数字人”离现实生活很遥远。
图二:“数字人”家族 。
现在一些应用级的“数字人”开始将进入哪些领域。据百度数字人与机器人业务负责人李士岩说,全国有2000多万听障朋友,与之不匹配的是提供专业手语的老师非常少,且从业意愿度在逐年降低,尤其是在一些法院、医院、机场、火车站等公共场所,给听障朋友提供无障碍基础设施与服务少。虚拟主播与手语“数字人”主播将慢慢填补这个空缺。此外,一些金融机构也在APP端引入和采用服务型“数字人”。
据《虚拟数字人深度产业报告》预计,2030年我国虚拟“数字人”市场规模将达到2700亿元。不过,目前,“数字人”真正落地发挥价值,还面临成本高、效率低、自由度低等诸多难题。
好在国内的研发机构加大技术突破的力度,加速“数字人”的落地。首先,无需高配硬件配置,进一步降低线上开播门槛。在云原生渲染技术的支持下,一台普通笔记本电脑、一个摄像头、即可实现一键开播,同时有第三方智能云提供高并发、低延迟、稳传输的渲染服务。
在人像生产环节,依托“数字人”人像生成引擎等技术,已经将超写实人像生成效率大幅提高,不仅能一键秒级生成六大风格的超高精人像,还提供1358个微调维度供用户“精雕细琢”。在动作捕捉上,通过单目动捕技术,实现一个普通手机摄像头即可驱动“数字人”,在降低成本的同时节省主播体力。
图三:线上直播平台的“数字人”。图片由百度智能云 提供
要实现“数字人”个性化IP的打造,自然离不开服装、特效等周边资产。今年,有关机构同步首发“数字服装解决方案”,结合布料的物理仿真插件、服装打版软件、虚拟服装库,为KA客户(关键客户)大幅降低数字服装制作成本,从万元降低至千元。可以预见,在线上各大领域,将有越来越多的“数字人”登场。