logo

MRCP助力美团语音交互升级

作者:问题终结者2024.11.28 11:14浏览量:27

简介:本文探讨了MRCP在美团语音交互中的实践和应用,介绍了MRCP协议的作用、美团自研ASR/TTS能力及MRCP如何赋能美团内部业务,提升了外呼通话成功率和用户体验。

智能语音对话作为人工智能领域的重要分支,近年来取得了显著进展,其核心技术如语音识别(ASR)、自然语言理解(NLU)、对话管理及语音合成(TTS)等不断成熟。美团作为国内领先的生活服务电子商务平台,积极探索并实践最前沿的语音交互技术,其中MRCP(Media Resource Control Protocol,媒体资源控制协议)在美团的语音交互系统中发挥着关键作用。

MRCP协议概述

MRCP是一种用于语音服务器向客户端提供各种语音服务的通信协议,如语音识别和语音合成。它定义了控制媒体处理资源所必需的请求(Request)、应答(Response)和事件(Event)等消息。通过MRCP协议,客户端可以高效地请求和控制语音资源服务器上的语音识别、语音合成等功能,实现自然流畅的语音交互体验。

在传统的语音应用中,各集成商必须针对不同的ASR/TTS厂商提供的API接口进行专门的集成开发,这导致了集成过程的复杂性和局限性。而MRCP协议作为目前针对媒体资源和IP网络起草的标准协议,为各种语音应用开发提供了更加灵活的选择,并有效地降低了业务开发周期和成本。

美团自研ASR/TTS能力

自2018年起,美团语音交互部持续投入语音识别(ASR)和语音合成(TTS)的自主研发,目前已形成平台级的服务能力。美团语音识别重点针对美团场景进行优化,相比通用场景的识别率更高。在电话呼叫场景的测试集中,美团语音识别的字准率达到94.6%,远超业界平均水平。而美团语音合成则从美团各场景出发,建立起从端到云一体化、全面覆盖客服、配送、听书等各个方向的合成音色群,并支持不同数据量级的语音定制化能力,在性能和效果层面达到了业界一流水准。

MRCP在美团语音交互中的实践

在美团的语音交互系统中,MRCP被广泛应用于语音识别领域。通过MRCP协议,美团实现了高效的语音识别和合成功能,为用户提供了更便捷、自然的交互方式。例如,在骑手语音助理、客服中心语音转译等典型业务场景中,美团语音交互系统已经落地应用,并取得了显著成效。

同时,美团还针对低延迟流式语音识别技术进行了深入研究和实践。在实际应用中,如何确保不同合成语音的音色一致性和降低延迟仍然是亟待解决的问题。而MRCP协议的应用,则有助于美团更好地解决这些问题,进一步提升用户体验。

MRCP赋能美团内部业务

随着美团自研的ASR/TTS逐步达到业界一流水平,美团内部越来越多业务接入美团自研的TTS和ASR能力。特别是TTS,在应用的业务场景中取得超过外采系统的效果。然而,在业务对接和优化过程中,也存在一些问题,如音色机械、音色不统一、合成延时过高等。而MRCP协议的应用,则有助于美团更好地解决这些问题,赋能内部业务,提升外呼通话成功率和用户体验。

结语

综上所述,MRCP作为语音交互系统中的关键通信协议,在美团的语音交互系统中发挥着重要作用。通过MRCP协议的应用,美团实现了高效的语音识别和合成功能,为用户提供了更便捷、自然的交互方式。未来,随着技术的不断进步和应用的深入拓展,MRCP在语音交互领域的应用前景将更加广阔。同时,美团也将继续投入研发力量,不断优化和完善语音交互系统,为用户提供更加优质的服务体验。在这一过程中,千帆大模型开发与服务平台作为强大的技术支持,将为美团语音交互系统的持续升级提供有力保障。

相关文章推荐

发表评论