百度UNIT2.0:你的对话系统训练专家

2018-07-15


UNIT是百度大脑推出的对话系统定制平台,整合了业内最先进的对话理解、对话控制以及NLP、深度学习、大数据等核心技术与资源,能够帮助开发者快速定制或开发属于自己的人机对话系统。

自2017年发布至今,UNIT已经吸引了超过10000名开发者,这些开发者们用UNIT开发了超过13000个对话技能,包含智能客服、车载、智能家居、机器人等各类场景。这些对话技能服务了来自旅游、汽车、酒店、企业办公、家庭教育、超市购物、电子政务等各行业的用户,与他们进行了超过32亿次人机对话。

这一年中,UNIT团队也加班加点地针对开发者的新需求进行了持续不断的升级。现在,升级版的UNIT2.0正式发布,它全方位地升级了技术、功能与架构,为开发者提供更加便利、更加专业的对话系统定制能力!

一、升级的对话理解能力

为了能够准确理解用户多样的需求表述,开发者通常需要为对话系统提供充足的训练数据,使理解模型能够充分学习用户的语言表达习惯。然而,训练数据的采集成本非常高,对开发者带来说门槛很高。

为降低开发者的研发门槛,UNIT对用户的表达进一步分析与抽象,提供了融合深度学习与启发式规则的意图理解模型,将系统词槽的深度与广度进一步扩展,还拿出了百度NLP压箱底的黑科技“口语化分析”与“query纠错”。结合这些技术,开发者在UNIT平台只需提供极少量数据就可让理解模型具备识别上图所有例子的泛化识别能力。

 

二、DM Kit:开源版对话管理与任务执行框架

搭建一个完整的对话系统,除了云端UNIT提供的理解能力和部分对话管理能力外,开发者还需要自行搭建控制业务流程的对话逻辑以及满足用户需求的资源检索与任务执行等操作(换台、查天气、下单等),对于没有对话系统研发经验的开发者来说,依然存在着不低的门槛。为此,UNIT2.0正式开源了百度内部使用的工业级对话管理与任务执行框架DM Kit。DM Kit可无缝对接UNIT云端对话理解能力,并轻松对接外部知识库,丰富BOT回复信息量,实现多状态的复杂对话流程控制,让开发者快速灵活的搭建对话产品。

 

三、黑科技:Interactive Learning,像人一样在对话中理解与学习

  

我们总是期望对话系统总是能够善解人意地给出正确的理解与答复。

但是,对话系统有时会让我们失望,给出这样的答复:

  

面对这样的问题,其实人类是可以轻易通过对话解决的。

 

 现在,根据百度大脑对人类对话行为的最新研究成果,UNIT2.0抽象整合了像人一样在对话中完成精确理解并持续学习的交互能力,称之为 “Interactive Learning”。

开发者只需正常定义对话任务,就可以得到系统内置的交互式理解能力,它可以主动发现系统理解模糊的问题并向用户进行澄清询问,也可以被动等待用户发起纠正。实验表明,该机制能够让98.1%的用户对话被系统正确的理解,让人工智能不再智障,真正智能起来! 同时, UNIT进一步配合升级了数据标注系统,让系统实现了从用户的对话中主动发现自身理解能力的局限,并持续学习的能力。

未来的对话系统训练师,将不再需要进行如下图所示的繁琐庞杂的数据标注工作。

 

想要优化系统?你只需要”跟它聊聊”

 

 

四、更多升级等你来发现

-架构升级全面 - 系统稳定性和训练效率大幅提升,以前30分钟的训练任务,现在你只需等待10秒

-全新的平台界面改版 - 平台操作交互体验更加流畅自然!

-标注交互升级——对话样本标注更简单,可以进行批量标注,让样本标注更高效。

-更多样的样本推荐功能——基于已有对话语料,通过多种更专业的推荐策略,扩展出更多元化的用户口语表达句式,帮助冷启动阶段迅速获得更丰富的训练数据。

-日志分析中心发布——深入分析用户日志,助力开发者快速发现问题,持续优化。

-平台管理API全面开放 – 每个开发者都可以根据自身行业需求,搭建属于你自己的行业对话系统定制平台。

 

未来,UNIT将持续推出更多强大的“黑科技”,也会开放技能、资源商店,以及更多垂直行业解决方案,为开发者提供更加易用、更加专业的对话系统定制工具。

欢迎使用理解与交互技术UNIT,打造你的专属人机对话系统。