人工智能作為一項賦能技術,如今已在多個行業領域逐步落地應用,不過現階段,人工智能在某些方面仍然處于技術提升期。本文將聚焦于人工智能的學術研究方面,簡要探討一下AI學術前沿和技術發展趨勢。
人工智能熱門技術研究課題
當前人工智能在諸多行業領域已經實現了廣泛應用,但在熱門技術方面來看,安全性等方面依然存在一定缺陷。 用簡單的“對抗性補丁”(adversarial patch)可以使得人臉識別在可靠性、安全性等失效。這也讓AI技術研究需要更加注重 人工智能 “攻”和“防”的課題,如何確保AI算法的高安全性、可靠性還有它的魯棒性,人工智能算法在安全方面 “攻”和“防”當前也是一個相當熱門的技術研究方向。
另外一個研究課題是 生成對抗網絡(GAN, Generative Adversarial Networks ),生成對抗網絡有非常多的應用,典型的應用在“圖像生成”和“數據增強”等方面,比如在安防領域人臉識別圖像的生成。生成對抗網絡如今也逐漸被應用在其他的一些應用領域,如生命科學中的材料設計,還有食品、藥物的設計,這些也成為人工智能技術新的研究方向。
邊緣計算同樣也是當下人工智能技術研究的重點之一。隨著物聯網時代的到來,越來越多的數據在邊緣端產生,邊緣計算由此成為顯著趨勢。現階段邊緣計算有多種計算方式決定什么應該放在邊緣端。目前人工智能的算法在主流方面是把算法放在云端,把編程中推理的部分放在邊緣端,這樣可以保證數據運算和訓練這一類需要大功率運算的過程在云端進行,而推理的過程則在邊緣端發生。不過這種模式可能會導致邊緣端的算法不夠智能,如何在邊緣端提升算法的智能程度是一個重要的研究方向。
寬度學習網絡的誕生,被認為是可以很好地替代原本的深度學習網絡,它基于將輸入隨機映射成為擴充節點作為輸入的思想而設計(依據早期隨機向量函數鏈接神經網絡,random vector functional-link neural network)。它可以非常快速的算出正確的映射,在數據的增量部分也可以實時的學習。 根據大量的測試結果顯示,在邊緣計算過程中,寬度學習的實時性應用效果非常不錯。
人工智能在理論上的瓶頸問題
譚鐵牛院士曾表示現階段的人工智能依然存在很大的局限性,用四句話概括便是:有智能沒智慧,有智商沒情商,會計算不會“算計”,有專才無通才。具體解釋一下在理論上局限的瓶頸問題主要包括:
(1) 數據瓶頸:深度學習需要大量的數據;(2) 泛化瓶頸:這是模式識別、計算機視覺、人工智能方法面臨的一個共同的問題,現有方法在一些實際問題中仍無法取得理想的泛化性能,或者訓練好的模型用在變化的環境或領域其泛化性能明顯下降;(3) 能耗瓶頸:人的大腦盡管是一個通用的人工智能系統但是能耗很低(只有20瓦),但現有計算機上實現的人工智能系統能耗很高;(4) 語義鴻溝瓶頸:目前語言服務大多為簡單查詢,不涉及語義推理問題,缺乏真正的語言理解能力,比如一些有歧義的自然語言句子,人很容易根據上下文或常識理解其真正含義,計算機卻很難理解;(5) 可解釋性瓶頸:現有人工智能系統都是知其然而不知其所以然,其過于依賴訓練數據,缺乏深層次數據語義挖掘。因此,可解釋性非常重要,人工智能不僅要知其然還要知其所以然,知其然只是淺層智能,知其所以然才叫深層智能;(6) 可靠性瓶頸:現有人工智能系統可靠性較差,有些錯誤識別結果會帶來致命后果,尤其在自動駕駛這樣的領域。
人工智能值得關注的技術研究方向
為了更好地破除上述人工智能技術研究的瓶頸問題,在AI學術研究領域,一些新的技術發展趨勢和研究方向也值得關注,包括:
(1) 從專用人工智能到通用人工智能是大勢所趨,一些科技巨頭包括國家機構都在布局通用人工智能的研究,微軟成立人工智能實驗室以挑戰通用人工智能為主要目標;
(2) 可解釋的人工智能系統備受關注,也將成為突破統計學習瓶頸問題的一個重要方向。DARPA的報告:第一個波次是基于規則的,例如以專家系統為代表的系列方法和技術;第二個波次就是當前以大數據驅動為代表的統計學習;同時,他們認為第三個波次很可能是可解釋的人工智能,就是人工智能要知其然還要知其所以然,以此可見人工智能可解釋性的重要意義;
(3) 小樣本甚至零樣本學習成為提高人工智能系統泛化能力的一個重要方向。最近提出的生成對抗網絡、膠囊網絡、生成模型等都是為了降低對訓練數據的需求,提高人工智能系統泛化能力的有益嘗試;
(4) 非深度神經網絡計算模型成為機器學習創新的一個重要方向。當前深度學習理論基礎薄弱、模型結構單一、資源消耗過高、數據依賴性強,以非神經網絡、資源節約型機器學習模型有望成為下一個突破口;
(5) 腦科學與人工智能深度融合、協同發展、相得益彰,IBM的TrueNorth芯片、美國DARPA的MICRONs研究項目以及最近Science和Nature雜志上發表的一些受腦啟發的智能計算模型都是這方面的典型例子。
寬度學習(BLS)網絡的研究和應用
除了上述這幾大AI學術研究要點之外,還有寬度學習(BLS)網絡也值得重點關注。寬度學習(BLS)自2018年由我們(陳俊龍教授及其團隊)首次在學術界提出,便迅速在科研機構(中科院)、國內知名高校及企業展開了較為廣泛的研究與應用。
雖然深度學習網絡非常強大,但大多數網絡都被極度耗時的訓練過程所困擾。首先深度網絡的結構復雜并且涉及到大量的超參數。另外,這種復雜性使得在理論上分析深層結構變得極其困難。另一方面,為了在應用中獲得更高的精度,深度模型不得不持續地增加網絡層數或者調整參數個數。為了克服這些問題, 寬度學習系統提供了一種深度學習網絡的替代方法,同時,如果網絡需要擴展,模型可以通過增量學習高效重建。
寬度學習(BLS)在設計思路方面,首先,利用輸入數據映射的特征作為網絡的「特征節點」;其次,映射的特征被增強為隨機生成權重的「增強節點」;最后,所有映射的特征和增強節點直接連接到輸出端,對應的輸出系數可以通過快遞的偽逆得出(或者梯度下降方法)。BLS 最重要的特點在于它的單隱層結構,具有兩個重要的優勢,一個是「橫向擴展」,另一個則為「增量學習」,與深度神經網絡不同之處在于,BLS 不采用深度神經網絡的結構,而是基于單隱層神經網絡構建,可以用「易懂的數學推導來做增量學習」。
直白來講, 深度神經網絡學習架構是在結構固定以后才開始學習,此后學習期間如果出現不準確情況,就要重新設計網絡、再學習一次。而寬度學習則是設計好網絡后,當面臨學習不準確的情況,可以隨時以橫向的方式進行增量擴充,即通過增加神經元,以提高準確度。這種增量學習的模式也適用在數據實時的進入已訓練成的神經網絡模型當中,而不用重新對整個收集的數據再重新訓練。
在安防領域,寬度學習網絡的應用主要表現在兩個方面:一是 提升人工智能識別的可靠性。比如在人臉識別算法訓練過程中,最好的數據當然是高清正臉無遮擋的干凈人臉數據,但實際上測試推理過程中,很多的人臉數據并不完美,會出現被遮擋(墨鏡、口罩)、模糊、非正臉角度的人臉照片。在做算法訓練過程中,我們可以基于寬度學習網絡架構,通過將干凈人臉圖片和缺陷人臉圖片融合到一起做訓練,甚至可以特意生成一些有缺陷的圖片樣本,由此來提高算法對缺陷圖片的識別準確率,從而提升復雜場景下人臉識別算法的場景適應能力。二是 解決數據標注的問題,在人工智能算法訓練過程中,數據的標注也非常重要,如果標注錯誤,那么不管算法有多精確,訓練的結果也不會理想。通過寬度學習網絡構建的算法模型,可以很好地解決算法標注錯誤的問題。
通過研究團隊的大量測試,可以看出寬度學習(BLS)以及它的各種變體和擴展結構具有良好的發展潛力,在實際應用中表現出其快速且高精度的優秀性能。目前寬度學習在很多技術領域都有展開應用,比如時間序列、高光譜分析、腦機信號分析、容錯、基因鑒定與疾病檢測、步態識別、3D打印以及智能交通等。隨著人工智能技術研究的持續深入,寬度學習這種不需要深度結構的高效增量學習系統有望加速助推人工智能的發展。