南宫NG28盖世汽车讯 据外媒报道,韩国电子与通信研究所(Electronics and Telecommunications Research Institute,ETRI)研究人员开发出超逼真的人工智能技术,仅需一张肖像照片,即可创建出像真人一样自然说话的虚拟形象。该技术被视为下一代人机界面,旨在实现人车之间的直观交互,为全自动驾驶时代做好准备,并有望在数字人类行业中推广。
目前,传统的语音驱动型人工智能助手(例如办公环境或车载导航系统)只能执行简单的指令,而ETRI的超逼真人工智能角色则拥有复杂的面部表情和嘴部动作,能够进行自然、类似人类的对话。
这使得人机交互更加以人为本,例如车载人工智能驾驶员可以与驾驶员对话或与行人互动。
这项技术的核心是一种独特的算法,与传统的生成式人工智能不同南宫NG28,它选择性地学习和合成与言语直接相关的面部部分,例如嘴唇和下巴。这种方法减少了不必要的信息学习,并允许更复杂的面部表情,包括嘴形、牙齿和皮肤皱纹。
除了自动驾驶汽车,该技术还可应用于自助服务终端、银行柜台、新闻发布、广告模特等各行各业,并有望推动基于人工智能的数字人行业的创新。
ETR的移动出席用户体验研究部门(Mobility User Experience Research Section)目前专注于人机交互(HMI)技术,同时也在开发基于人工智能的驾驶员界面技术,用于分析驾驶员和行人的情绪、疲劳程度、注意力等。
移动用户体验研究部门主管Daesub Yoon表示:“随着移动晨曦技术的不断发展,老年人和社会弱势群体可能会被边缘化。我们希望这项人工智能虚拟形象技术能够提升人们的数字素养,让所有人都能更便捷地享受智能移动服务。”
高级研究员Daewoong Choi也表示:“我们计划进一步推进我们的生成式人工智能技术,使人工智能虚拟形象能够像真人一样自然地说话和行动。未来,我们的目标是实现能够替代部分人工操作的交互,例如订购、咨询等。”
该技术目前已在ETRI技术转让网站上注册,注册号为“逼真说话人脸生成框架(A Framework for Photorealistic Talking Face Generation)”。研究人员还将积极推进技术转让,并制定在各行业的商业化战略。