句子大全

句子大全 > 句子大全

语音机器人SIP通话场景下如何捕获用户电话按键信号

句子大全 2013-02-25 16:19:23
相关推荐

随着互联网技术的发展和网络的普及,线上告警已经由早期的短信/邮件通知发展为微信/电话语音等方式,由于短信/邮件等告警方式存在延时问题,不能及时告知被通知对象,业内开始流行将服务器接收到的告警内容通过TTS(语音合成)合成语音后告知用户,用户按键选择主动处理或移交给其他负责人,智能语音机器人基于TTS和SIP实现了语音播报功能与按键识别功能的结合,应用于58运维告警以更及时、更便捷、更多元的方式通知开发维护人员,并将此功能应用于校招邀约等场景,代替或辅助人工完成一些流程固定的工作,可以有效地节省成本提高人效,如图1.图1使用场景 整体流程 智能语音机器人基于SIP线路实现的呼出场景下,用户电话按键信号捕获需要借助SIP线路实现,整体流程如图2,在代理终端A(用户)与代理终端B(机器人)持续通话的过程中,用户会持续向机器人发送媒体流,机器人在接收媒体流时会判断当前流属于语音流还是按键信号,如果当前流属于语音流则经过语音解码器,如果是按键信号则经过按键信号识别模块,最终产生语音数据/按键信息再做下一步处理。图2整体流程 如何传输 1、按键信号如何传输 目前所有的电话和传真机按键都采用DTMF信号进行编码和传输,DTMF信号是利用模拟信号对数字符号进行编码,该编码方案共使用8个模拟频率对16个符号进行编码,分为高音群和低音群,所以称为双音多频(Dual-ToneMultiple-Frequency)编码,每个符号由一个高音频率和一个低音频率唯一确定(0~9*#ABCD),如图3.图3DTMF信号编码 2、SIP如何检测DTMF信号 目前传输DTMF信号主要有三个方式:通过通信协议传输(SIPINFO)、遵循RFC2833规范传输、通过RTP的数据内容传输(INBAND)。 1)SIPINFO 通过SIP信令INFO包中的signal字段携带DTMF信号传输,这种方式的好处是不影响RTP数据包的传输,但SIP信令和媒体传输是分开的,很容易造成DTMF信号和媒体包不同步。 2)RFC2833 通信前使用SDP协议协商telephone-event参数,通过RTP包传输,由RTP包包头的PT(payloadtype)来标示RFC2833的数据包(如图4)。 3)INBAND 将DTMF信号不经任何处理直接打成RTP包与普通的RTP语音包混在一起传输,要获得DTMF信号则必须提取RTP数据包进行频谱分析,得到高频和低频的频率,然后查表得到对应的按键。图4RTP包格式 如何识别 综合考虑,遵循RFC2833规范实现基于SIP的电话按键信号识别成本最低,下面将详细介绍下SIP会话如何建立,媒体如何协商、基于会话和媒体协商结果如何实现电话按键信号的解析。 1、会话建立 SIP(Session Initiation Protocol)是一种信令协议,用于初始化、管理和终止网络语音和视频会话,如图5,终端代理A为主叫代理,终端代理B为被叫代理,A与B的会话建立流程如下: 1)A先发送INVITE请求至代理服务器(一般为SIP运营商提供),代理服务器将INVITE请求转发给B; 2)代理服务器给A返回呼叫处理中的100TRYING应答消息; 3)B向代理服务器发送呼叫处理中的100TRYING应答消息; 4)B发现用户振铃后,向代理服务器发送180RINGING振铃消息,代理服务器收到后转发给A; 5)B发现用户接听后,向代理服务器发送200OK消息表示连接成功,代理服务器将200OK转发给A; 6)A收到请求后,发送ACK消息进行确认,代理服务器再将ACK消息转发给B; 7)主被叫用户之间建立通信连接,开始通信;图5SIP信令交互 2、媒体协商 SDP(Session Description Protocol)协议主要用于两个会话实体的媒体协商,描述会话所使用的的流媒体细节,协议格式如图6,以 type = value 形式存储,其中: 1)c表示连接信息,用于约定IP协议版本、IP地址等信息; 2)a表示会话信息,用于约定会话使用的编解码器、按键事件(telephone-event)的RTP包包头等信息; 3)m表示媒体信息,用于约定会话为音频或视频通话、接收媒体流的端口等信息;图6SDP协议格式 主被叫通过SDP协议协商媒体信息流程如下: 1)在会话建立过程中,主叫向被叫发送INVITE请求时携带SDP协议,约定主叫接收媒体流的IP地址及端口、编解码器、按键事件等信息; 2)在被叫给主叫回复180RINGING振铃消息时携带SDP协议,同样也约定了被叫的相关信息; 3)主被叫通信建立,按照SDP协议约定的媒体信息进行通信; 3、按键信号解析 遵循RFC2833规范,按键DTMF信号使用RTP包发送,通过RTP包头PT(payloadtype)来标示RFC2833数据包,基于以上信息并参考图6中SDP协议约定信息(a=rtpmap:126telephone-event/8000)可将按键解析步骤总结如下: 1)在接收RTP包时,当包头PT=126时,RTP包体中存储的内容即为按键信息; 2)由于RTP是基于UDP协议封装的,为了防止丢包,同一个按键信号会产生多个RTP包且包头中Timestamp相同,我们可根据包头的时间戳去重; 3)至此我们就可以成功解析基于SIP的电话按键信号;图7按键解析 58同城TEG技术工程平台群AILab,旨在推动AI技术在58生活服务行业的落地,打造AI中台能力,以提高前台业务的人效和用户体验。AILab目前负责的产品包括:智能客服、语音机器人、智能写稿、AI算法平台、智能语音分析平台、语音识别引擎等,未来将持续加速创新,拓展AI应用。 58同城TEG技术工程平台群AILab,旨在推动AI技术在58生活服务行业的落地,打造AI中台能力,以提高前台业务的人效和用户体验。AILab目前负责的产品包括:智能客服、语音机器人、智能写稿、AI算法平台、智能语音分析平台、语音识别引擎等,未来将持续加速创新,拓展AI应用。 【作者介绍】 李鸿勋,58同城AILab资深后端工程师,2017年加入58同城,目前主要负责智能语音机器人后端架构设计和研发,曾先后从事58同城推荐系统、智能客服系统后端研发工作。

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新