人工神經網路

第一章人工神經網路

人工智慧的深度學習(deep learning),也叫做深度神經網路,是從人工神經網路(Artificial Neural Network)發展而來的。它是一種模仿動物大腦結構與功能的數學模型或計算模式,我們先看一下大腦神經元是如何傳遞訊息的。

下圖上的神經元細胞接受到左方訊號後,會將訊號處理後再傳遞給右方的神經元細胞。接受訊號是使用較靠近細胞核(nucleus)的樹突(dendrite)傳遞訊號則是使用軸突末端(axon terminals),它和另外神經元的樹突,會形成所謂突觸(synapse)的接觸點,來進行電子或化學反應。不論接受或傳遞訊號,都可來自或經由一個以上的神經元。

我們可以用上圖下再把概念精簡類比一下。一個神經元細胞可當作一個節點,當來自其他神經元的訊號,進入節點經過處理後,可以把訊息再傳遞給其他節點。一個節點的訊號可來自多個節點,並把訊號傳遞給其他多個節點,這個概念可擴充成神經網路的初步雛形如下圖

上圖上是一個簡易的神經網路結構,每個圓圈當作一個節點,縱向垂直排列的多個節點形成一個神經層,在此只有三個神經層,由左至右分別是輸入層、隱藏層、輸出層。

在這裡可以和幼兒的腦細胞發育做一個比較。嬰兒從出生到兩歲,神經元數量基本沒有變化,大腦在胎兒剛出生時,就配備了基本所有神經元,只是後來建立了很多突觸以連接其他神經元。這兩年當中,大腦每秒就產生700個突觸連接如下圖所示:

上面這種比較完整的神經元結構圖,就可以用下面的深度神經網路來模擬。其輸入層和輸出層當中的隱藏層數目,以及任一個神經層的節點數,都可做增減,來改變相鄰神經層中間權重矩陣的大小。

兩兩相鄰神經層中間交叉重疊的線條,就代表這些權重矩陣。一般而言,權重矩陣的元素越多,預測的準度也會越高,但同時也必須輸入更多的資料來訓練模型。

Leave a Comment

Your email address will not be published. Required fields are marked *

Shopping Cart