我們知道,微信最開始就是做語音聊天而使得其更加流行的,因此語音的識別處理自然也就成為微信交流的一個重要途徑,微信的開發接口,也提供了對語音的消息請求處理。本文主要介紹如何利用語音的識別,對C#開發的微信門戶應用的整個事件鏈的處理操作,使得在我們的微信賬號裡面,更加方便和多元化對用戶的輸入進行處理。
微信的API這麼定義語音的識別的:開通語音識別功能,用戶每次發送語音給公眾號時,微信會在推送的語音消息XML數據包中,增加一個Recongnition字段。
語音的消息格式如下所示。
<xml> <ToUserName><![CDATA[toUser]]></ToUserName> <FromUserName><![CDATA[fromUser]]></FromUserName> <CreateTime>1357290913</CreateTime> <MsgType><![CDATA[voice]]></MsgType> <MediaId><![CDATA[media_id]]></MediaId> <Format><![CDATA[Format]]></Format> <MsgId>1234567890123456</MsgId> </xml>
根據以上微信接口的定義,我們可以定義一個實體類來對消息的傳遞進行處理,如下所示。
/// <summary>
/// 接收的語音消息
/// </summary>
[System.Xml.Serialization.XmlRoot(ElementName = "xml")]
public class RequestVoice : BaseMessage
{
public RequestVoice()
{
this.MsgType = RequestMsgType.Voice.ToString().ToLower();
}
/// <summary>
/// 語音格式,如amr,speex等
/// </summary>
public string Format { get; set; }
/// <summary>
/// 語音消息媒體id,可以調用多媒體文件下載接口拉取數據。
/// </summary>
public string MediaId { get; set; }
/// <summary>
/// 消息ID
/// </summary>
public Int64 MsgId { get; set; }
/// <summary>
/// 語音識別結果,UTF8編碼
/// </summary>
public string Recognition { get; set; }
}
我們看到,這裡我們最感興趣的是語音的識別結果,也就是Recognition的字段,這個就是微信服務器自動根據用戶的語音轉換過來的內容,我測試過,識別率還是非常高的。
這個實體類,在整個微信應用的消息傳遞中的關系如下所示:

明確了上面的語音對象實體,我們就可以看看它們之間是如何處理的。
微信消息的處理邏輯如下圖所示。

其中我們來看看語音的處理操作,我的代碼處理邏輯如下所示。
/// <summary>
/// 對語音請求信息進行處理
/// </summary>
/// <param name="info">語音請求信息實體</param>
/// <returns></returns>
public string HandleVoice(Entity.RequestVoice info)
{
string xml = "";
// 開通語音識別功能,用戶每次發送語音給公眾號時,
// 微信會在推送的語音消息XML數據包中,增加一個Recongnition字段。
if (!string.IsNullOrEmpty(info.Recognition))
{
TextDispatch dispatch = new TextDispatch();
xml = dispatch.HandleVoiceText(info, info.Recognition);
}
else
{
xml = "";
}
return xml;
}
在這裡,我先看看,是否獲得了微信的語音識別結果,如果獲得,那麼這個時候,就是和處理用戶文本輸入的操作差不多了,因此把它轉給TextDispatch的處理類進行處理。
其中這裡面的處理邏輯如下所示。

首先我根據識別結果,尋找是否用戶讀出了微信門戶的菜單名稱,如果根據語音結果找到對應的菜單記錄,那麼我們執行菜單事件(如果是URL的View類型菜單,我們沒辦法重定向到指定的鏈接,因此給出一個鏈接文本提示,給用戶單擊進入;如果沒有找到菜單記錄,那麼我們就把語音識別結果作為一般的事件進行處理,如果事件邏輯沒有處理,那麼我們最後給出一個默認的語音應答提示結果就可以了。
具體的處理代碼如下所示。
/// <summary>
/// 如果用戶用語音讀出菜單的內容,那麼我們應該先根據菜單對應的事件觸發,最後再交給普通事件處理
/// </summary>
/// <param name="info"></param>
/// <returns></returns>
public string HandleVoiceText(BaseMessage info, string voiceText)
{
string xml = "";
MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText);
if (menuInfo != null)
{
#region 如果找到菜單對象的處理
if (menuInfo.Type == "click")
{
//模擬單擊事件
RequestEventClick eventInfo = new RequestEventClick();
eventInfo.CreateTime = info.CreateTime;
eventInfo.EventKey = menuInfo.Key;
eventInfo.FromUserName = info.FromUserName;
eventInfo.ToUserName = info.ToUserName;
xml = base.DealEvent(eventInfo, eventInfo.EventKey);
}
else
{
//由於無法自動切換到連接,
//轉換為連接文本供用戶進入
string content = string.Format("請單擊鏈接進入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name);
ResponseText textInfo = new ResponseText(info);
textInfo.Content = content;
xml = textInfo.ToXml();
}
#endregion
}
else
{
//交給事件機制處理
if (string.IsNullOrEmpty(xml))
{
xml = HandleText(info, voiceText);
}
}
//最後如果沒有處理到,那麼提示用戶的語音內容
if (string.IsNullOrEmpty(xml))
{
ResponseText textInfo = new ResponseText(info);
textInfo.Content = string.Format("非常抱歉,您輸入的語音內容沒有找到對應的處理方式。您的語音內容為:{0}", voiceText);
xml = textInfo.ToXml();
}
return xml;
}
微信門戶測試界面效果如下所示。

為了方便對客戶會話的記錄,我的微信門戶後台,會記錄用戶的語音輸入內容,如下所示。

當然,微信後台的管理界面,也能夠查到相應的語音記錄,界面如下所示。

以上就是我對微信語音的消息定義和事件處理的邏輯,其實語音是一個重要的輸入,如果正確的識別內容,比手工輸入的效果更好,給用戶提供另外一種高效的輸入和事件處理操作。
這樣的處理模式,能夠使得我們整個微信門戶框架,不管是對於用戶的語音輸入,還是文本輸入,還是菜單事件的處理,都可以融為一體,實現更加完美的銜接。
如果對這個《C#開發微信門戶及應用》系列感興趣,可以關注我的其他文章,系列隨筆如下所示:
C#開發微信門戶及應用(11)--微信菜單的多種表現方式介紹
C#開發微信門戶及應用(10)--在管理系統中同步微信用戶分組信息
C#開發微信門戶及應用(9)-微信門戶菜單管理及提交到微信服務器
C#開發微信門戶及應用(8)-微信門戶應用管理系統功能介紹
C#開發微信門戶及應用(7)-微信多客服功能及開發集成
C#開發微信門戶及應用(6)--微信門戶菜單的管理操作
C#開發微信門戶及應用(5)--用戶分組信息管理
C#開發微信門戶及應用(4)--關注用戶列表及詳細信息管理
C#開發微信門戶及應用(3)--文本消息和圖文消息的應答
C#開發微信門戶及應用(2)--微信消息的處理和應答
C#開發微信門戶及應用(1)--開始使用微信接口