台灣現在產業也面臨少子化的衝擊,除了製造業以外,服務業也受到人力匱乏的引響,許多企業與公司亦開始著手將內部作業流程進行科技化與數位轉型,藉此做為因應勞動人口不足的手段;而做為電信龍頭的中華電信亦相當早就意識到問題,畢竟電信業務相當依賴第一線客戶服務為其客戶解惑與排除問題,然而由於電信業務總類繁多,客服人員人力有限又經常面對重複問題,故透過科技手段降低人力負擔即是中華電信的一大課題。
而中華電信旗下的中華電信研究院當中,不僅在新一代通訊技術、物聯網、雲端運算以外進行研究,包括人工智慧與深度學習等領域亦為其專注的領域,十個研究單位當中的巨量資料研究所彙集百餘位大數據領域專家,在嚴謹的資料安全保護下進行大數據的極大化應用,並且開發多元的應用,而與中華電信本身最息息相關的包括聊天機器人與 104 查號台語音辨識服務。
據中華電信研究院副院長陳榮貴博士表示,現在聊天機器人 Chatbot 早已廣泛被企業導入,不過多數的企業僅是導入由外部軟體公司或是服務平台提供的解決方案,而中華電信研究院則一手包辦自前端開發到應用層面,並以中華電信的巨量數據資料與技術做為後盾,提供合乎電信服務的解決方案。
為了降低客服人員負擔,中華電信先以基於 Chatbot 的智慧文字客服解決客戶的常見問題,透過語意分析方式解決客戶的常見問題,減少客服電話人力並降低客戶等待時間與服務品質。然而光是只有文字客服仍不足以解決電信業所需提供的服務需求,故中華電信也意圖導入基於人工智慧的語音客服,但語音系統所牽涉的遠比文字更為複雜,加上語音轉文字後的複雜度更牽涉到口音差異、語意分析,故此時需要仰賴更大的運算量解決語音客服系統所需的深度學習與神經網路。
中華電信在 AI 語音客服系統開發的同時,在 2010 年之際已著手研究影像分析與人臉辨識系統,不過當時深度神經網路由於 GPU 加速還未成熟,以當時的技術,中華電信並未突破 80% 的準確度,但也由於中華電信持續研發影像分析與人臉辨識系統,後續也發現 NVIDIA GPU 對於影像辨識的優勢,並將其導入系統架構,中華電信導入 Tesla K80 加速器與神經網路架構後,在短短一年內達到 91.1% 的精確度,並且進行 2 萬人共 100 萬張的人像資料庫訓練亦僅需要 72 小時,中華電信雖認為超過 9 成已經是相當大的突破,但仍未因此滿足,此時也決定加碼導入 NVIDIA 的 GPU 。 中華電信於 2017 年導入基於 Pascal 架構的 Tesla P100 GPU ,在進行相同的訓練庫數量培訓後,僅需 24 小時就達到原本需 72 小時的模型訓練,同時在同年底更導入 DGX-1 超級電腦,以新一代的 NVIDIA Tesla V100 GPU 再度把訓練時間縮減至 1/3 ,同時精確度進一步達到 99.6% 的高水準,而中華電信也同步將 NVIDIA GPU 加速應用在 AI 語音客服。
中華電信起初使用傳統基於 CPU 的 AI 模型訓練試圖建構語音客服的人工智慧模型,但成果與性能還無法合乎中華電信的要求;中華電信除了導入 kaldi nnet3 語音辨識工具進行 TDNN 訓練外,透過 NVIDIA Tesla V100 GPU 進行培訓,不僅將訓練語料由 48 小時大幅提高到 1,000 小時,能夠進行更複雜的語意分析,還把語言與語意的辨識精確度由 47.53% 提升到 82.8% 。
同時,中華電信也看到擁抱開放的創新力量,為使更多企業、教育機構與創客能享用到 AI 資源,中華電信還將雲端 AI ( Paas + Iaas )平台開放,讓有志於 AI 深度學習服務的開發者,能夠利用中華電信所提供的平台作為開發影像辨識、語音合成、語音辨識等技術與服務,以擁抱開放攜手開發者進行 AI 技術創新與應用開發。
|