一、如何评价米哈游虚拟偶像「鹿鸣」的首次直播
1、在虚拟偶像界,米哈游的新生代虚拟主播“鹿鸣”首次直播的表现引起了热烈讨论。许多人猜测,米哈游可能正在探索前沿的科技手段,以“逆熵 AI生成”技术重新定义虚拟主播的互动体验。这种技术并非简单的文本转语音(TTS),而是借助实时的Voice Conversion(VC)模型,实现了中之人角色声音的巧妙变换,配以精准的动作捕捉,让互动过程更为生动。
2、独特之处在于鹿鸣的细节处理,例如她模仿猪叫的独特音色、口误时节奏的微妙变化,以及拍手声的精准延时和气声的运用,这些都暗示着背后可能采用的是Style Transfer技术,以及对多模态模型的深度应用。然而,尽管如此,鹿鸣的直播中并未展示出复杂的多因素同步,这可能表明米哈游目前正逐步完善这一领域。
3、生成模型在声音的真实感上有所调整,使得“呼”声呈现出统一的质感。为了提升动作的自然度,可能采用了预制动画和表情的改进,但动作捕捉技术的挑战和数据清洗工作不可忽视。鹿鸣的动作虽然丰富,但存在重复,这可能通过Motion Matching技术来减少错误和变形,而手部捕捉则可能采用类似独立的技术。尽管头发和布料的实时渲染令人赞叹,但语音部分可能还未实现完全的实时处理。
4、在舞蹈表演中,人工智能通过预测来控制节奏,但短期内它仍难以完全替代中之人的情感投入和剧本的精心设计。作者预测,至少在未来三年内,中之人在虚拟主播的角色中仍将是不可替代的。这是因为自然语言理解、常识和计算创造力这些高阶技能,对于人工智能来说,仍存在着巨大的挑战,它们的输出往往带有不可预知性和不确定性。
5、直播内容的合规性至关重要,尤其是在开放领域问答中,避免误导和涉及复杂审查,如政治立场、偏见和事实错误,对米哈游这样的大型公司来说,这是一个不容忽视的风险。然而,这些推测仅基于现有信息,米哈游的下一步动向,让我们拭目以待。