深度神經網絡(Deep Neural Network, DNN)一詞對我們來說可能有些陌生,但如果說到人工智能(Artificial Intelligence, AI)大家一定都有所耳聞。
作為被奧迪康搭載在助聽器芯片上的技術,DNN到底是什么呢?與現在大熱的AI又有何關聯?讓我們通過本篇推文來揭開DNN的神秘面紗吧!
-01-什么是DNN?
在了解DNN之前,我們先來看一看AI是什么——當一臺機器根據一組特定的解決相應問題的算法執行任務時,這種智能可以被稱為人工智能(AI)。
這是一個廣泛的概念,它的包含范圍很大,包括識別、學習、解決問題,甚至可以讓AI擁有創造力。
我們日常生活中用到的語音識別(Siri)、圖像識別(淘寶識物)和虛擬客服等等,都是AI。
上圖中我們可以看出,AI所包含的范圍最廣,其中機器學習(ML)就是被包含的一支,它更依賴于人為的干預、參數設定來進行學習。而深度學習(DL)又是機器學習的一支,它能夠根據模型和大量的數據訓練來進行自我學習,擅長處理龐大的、復雜的數據。
那DNN在哪里呢?它包含在上圖中的深度學習中,DNN是由一個3層以上的神經網絡組成的,是深度學習算法的一種。
神經網絡可以接收大量的數據,并通過多個不同層面來處理它們,從而了解數據的復雜特征,然后就可以對數據做出有理有據的判斷。
例如學習相貌特征,對人物進行判斷
根據推測是對還是錯,DNN將利用這一結果,學習并嘗試對新數據做出判斷。通過這些嘗試和錯誤不斷學習,最終能夠對未知數據做出準確的決策。這種層級式的神經網絡和它學習及訓練的方式與大腦類同。
-02-為什么選擇DNN?
目前DNN常常被用于處理聲音信號、圖像、面部識別等問題。
就聲音而言,我們日常生活中的聲音場景有一個特征就是復雜多變,一些聲源甚至是不斷移動的!如果需要人為的要對如此多種聲音進行特征提取,將是一個龐大的工程量,并且可能會存在缺漏的情況。
對于這種每天都面臨著的各種各樣的聆聽挑戰,想得到一個能夠在這種復雜聆聽環境中正確處理聲音信號的算法,就需要一個龐大的訓練數據集來對算法進行訓練。
而DNN在學習過程中大部分的特征提取為部分自動化,消除了一些所需的人工干預,并可以使用更大的數據集,DNN會自動確定特征的層次結構,從而區分不同類別的數據。相較而言,機器學習更依賴于人工干預,需要人為的輸入所需的特性、層次結構等,數據集也不如DNN來得大。
說到這里,
相信選擇DNN的理由已經不言而喻了。
-03-如何讓訓練效果正確且卓越?
我們在前面提到了需要一個訓練數據集來對算法進行訓練,那么如何才能達到正確且卓越的訓練效果?
訓練太少會導致定義太寬泛,會出現欠擬合的問題,也就是找到的規律模型沒能夠很好的捕捉數據特征,不能很好的擬合數據;但訓練過多,定義又會太狹窄,出現過擬合的問題,也就是記住的規律太多,太具體死板地記住訓練數據集。那么奧迪康是如何劃定合適的訓練數據集范圍的?
答案是,立足現實——奧迪康的科研人員在真實的生活環境中,應用球形麥克風從各個角度收集了1200萬種聲音場景,以此為訓練數據集對DNN進行訓練,讓搭載在Polaris平臺上的DNN能夠學會并完成對生活中會遇到的各種各樣的聲音場景進行精準地判斷和處理。盡可能保證DNN得到的訓練是適當且正確的。
-04-在More中DNN扮演了什么角色?
奧迪康在行業內首次將DNN搭載在助聽器平臺上,并以此作為核心,推出突破性創新性能『AI全聲景領航系統』,助力奧迪康More利用DNN的智能功能來模擬大腦的學習方式,自動根據開發過程中獲得的經驗和培訓來處理所有聲音。
奧迪康More的深度神經網絡
不僅僅是一個標準的人工智能軟件
更一種獨特的專用助聽器解決方案
專為日常生活中的實時操作而開發
這種建立在現實生活場景之上的聲音處理
能夠讓用戶獲得更加
清晰、完整、平衡的全聲景感知
文字 / Demant中國培訓部 蔣澤宸
文獻參考:Ibm.com (2006, May). AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?
Upgrad.com (2019, September). Deep Learning vs Neural Networks: Difference Between Deep Learning and Neural Networks
Towardsdatascience.com (2018, September). Clearing the Confusion: AI vs Machine Learning vs Deep Learning Differences.
Mckinsey.com (2020) An executive’s guide to AI.