而家雖然已經有唔少智能語音助理嘅技術,但都喺需要有相關嘅語音辨識系統支援。對於廣東話而言,呢種資源目前只有大企業先可以做到,所以Mozilla最近就製作開源廣東話辨識引擎,專為中小企同獨立開發者而設。
Mozilla嘅Common Voice計畫,本身已經包括咗全球甚多語言,透過開源方式希望可以令語音辨識引擎開發嘅門檻降低。為咗解決而家數據俾大公司壟斷嘅局面,Mozilla透過眾包方式收集大量語音數據,俾辨識引擎能夠普及。而喺呢個計畫入面,廣東話都包含喺入面。Mozilla指出:「要打破呢種由『大台』壟斷嘅局面,令語音數據能夠俾人公開自由地使用,Mozilla亦都會創造一套稱為Deep Speech嘅開放原始碼語音辨識引擎。集合所有人嘅力量,將語音辨識技術發展得更好」。
講到粵語,自然就喺香港人嘅拿手好戲。所以Mozilla就邀請香港人幫忙提供聲音樣本,只要喺Mozilla嘅網站登記或者電郵團隊聯絡就可以參加。參加者需要提供公共領域嘅廣東話句子、審查句子嘅正確性;幫句子錄音;同咪檢驗錄音喺咪同句子相符。計畫收集到嘅數據同豐富,就可以整到更準確嘅語音,甚至變成引擎,令廣東話語音辨識應用帶黎更好嘅效果。
https://voice.mozilla.org/zh-HK
來源:Mozilla
想知道更多有關港語學嘅資訊?請立即訂閱港語學telegram channel同Instagram,跟貼廣東話最新消息!
Telegram:https://t.me/gongjyuhok
Instagram:https://instagram.com/gongjyuhok/