閱讀(2.6k) 書簽贊(0) 我要糾錯

Keras 深度學習概述

2021-11-01 10:02 更新

深度學習是機器學習的一個不斷發(fā)展的子領域。深度學習設計逐層分析輸入，其中每一層逐步提取有關輸入的更高級別的信息。

讓我們以分析圖像的簡單場景為例。首先假設，你輸入的圖像被分成一個矩形像素網(wǎng)格?，F(xiàn)在：

第一層抽象像素；
第二層理解圖像中的邊緣；
下一層從邊緣構造節(jié)點，然后，下一個會從節(jié)點找到分支；
最后，輸出層將檢測到完整的對象。

在這里，特征提取過程從一層的輸出到下一層的輸入。

通過使用這種方法，我們可以處理大量的特征，這使得深度學習成為一個非常強大的工具。深度學習算法也可用于分析非結構化數(shù)據(jù)。下面，我們通過本章內(nèi)容來了解深度學習的基礎知識。

人工神經(jīng)網(wǎng)絡

深度學習最流行和主要方法是使用 "人工神經(jīng)網(wǎng)絡(ANN)"。它們的靈感來自人腦模型，這是我們身體中最復雜的器官。人腦由超過 900 億個稱為 “神經(jīng)元” 的微小細胞組成。神經(jīng)元通過稱為 “軸突” 和 “樹突” 的神經(jīng)纖維相互連接。軸突的主要作用是將信息從一個神經(jīng)元傳遞到與其相連的另一個神經(jīng)元。

同樣，樹突的主要作用是接收由它所連接的另一個神經(jīng)元的軸突傳遞的信息。每個神經(jīng)元處理一個小信息，然后將結果傳遞給另一個神經(jīng)元，這個過程繼續(xù) 。這是我們?nèi)四X用來處理大量信息（如語音、視覺等），并從中提取有用信息的基本方法。

1958年，心理學家弗蘭克·羅森布拉特(Frank Rosenblatt)在此模型的基礎上發(fā)明了第一個人工神經(jīng)網(wǎng)絡(ANN)。人工神經(jīng)網(wǎng)絡由多個節(jié)點組成，類似于神經(jīng)元。節(jié)點緊密互連并組織成不同的隱藏層。輸入層接受輸入數(shù)據(jù)，數(shù)據(jù)依次通過一個或多個隱藏層，最后輸出層預測輸入數(shù)據(jù)的有用信息。

單個神經(jīng)元(在 ANN 中稱為感知器)，可以表示如下：

這里：

多個輸入連同權重代表樹突。
輸入和激活函數(shù)的總和代表神經(jīng)元。求和實際上是指所有輸入的計算值，激活函數(shù)代表一個函數(shù)，將求和值修改為0、1或0到1。
實際輸出代表軸突，輸出將被下一層神經(jīng)元接收。

多層感知器

多層感知器是 ANN 的最簡單形式。它由單個輸入層、一個或多個隱藏層和最后一個輸出層組成。一個層由一組感知器組成。輸入層基本上是輸入數(shù)據(jù)的一個或多個特征。每個隱藏層由一個或多個神經(jīng)元組成，處理特征的某些方面，并將處理后的信息發(fā)送到下一個隱藏層。輸出層過程接受來自最后一個隱藏層的數(shù)據(jù)并最終輸出結果。

卷積神經(jīng)網(wǎng)絡（CNN）

卷積神經(jīng)網(wǎng)絡是最流行的人工神經(jīng)網(wǎng)絡之一。廣泛應用于圖像和視頻識別領域。它基于卷積的概念，一個數(shù)學概念。除了在全連接隱藏神經(jīng)元層之前包含一系列卷積層和池化層之外，它幾乎類似于多層感知器。它具有三個重要的層：

卷積層 它是主要的構建塊，并基于卷積函數(shù)執(zhí)行計算任務。
池化層 它被安排在卷積層旁邊，用于通過刪除不必要的信息來減少輸入的大小，從而可以更快地執(zhí)行計算。
全連接層 它被安排在一系列卷積和池化層旁邊，并將輸入分類為各種類別。

一個簡單的 CNN 可以表示如下：

這里：

使用了2個系列的卷積層和池化層，用來接收和處理輸入（例如圖像）。
使用單個全連接層，用于輸出數(shù)據(jù)（例如圖像分類）

循環(huán)神經(jīng)網(wǎng)絡（RNN）

循環(huán)神經(jīng)網(wǎng)絡 (RNN) 可用于解決其他 ANN 模型中的缺陷。嗯，大部分 ANN 不記得之前情況的步驟，并學會了根據(jù)訓練中的上下文做出決策。同時，RNN 存儲過去的信息，它的所有決定都是根據(jù)它從過去學到的東西做出的。這種方法主要用于圖像分類。有時，我們可能需要展望未來以修復過去。在這種情況下，雙向 RNN 有助于從過去學習并預測未來。例如，我們在多個輸入中有手寫樣本。假設我們在一個輸入中有混淆，那么我們需要再次檢查其他輸入以識別從過去做出決定的正確上下文。

人工神經(jīng)網(wǎng)絡的工作流程

讓我們首先了解深度學習的不同階段，然后了解 Keras 如何在深度學習過程中提供幫助。

收集所需數(shù)據(jù)

深度學習需要大量輸入數(shù)據(jù)才能成功學習和預測結果。因此，首先要收集盡可能多的數(shù)據(jù)。

分析數(shù)據(jù)

分析數(shù)據(jù)并獲得對數(shù)據(jù)的良好理解。需要更好地理解數(shù)據(jù)才能選擇正確的 ANN 算法。

選擇算法（模型）

選擇最適合學習過程類型（例如圖像分類、文本處理等）和可用輸入數(shù)據(jù)的算法。算法在 Keras中用Model表示。算法包括一層或多層。ANN 中的每一層都可以用Keras 中的 Keras 層表示。

準備數(shù)據(jù) - 處理、過濾和僅從數(shù)據(jù)中選擇所需的信息。
拆分數(shù)據(jù) - 將數(shù)據(jù)拆分為訓練和測試數(shù)據(jù)集。測試數(shù)據(jù)將用于評估算法/模型的預測（一旦機器學習）并交叉檢查學習過程的效率。
編譯模型 - 編譯算法/模型，以便通過訓練進一步學習并最終進行預測。這一步需要我們選擇損失函數(shù)和優(yōu)化器。在學習階段使用損失函數(shù)和優(yōu)化器來發(fā)現(xiàn)錯誤（與實際輸出的偏差）并進行優(yōu)化，以使錯誤最小化。
擬合模型 - 實際學習過程將在此階段使用訓練數(shù)據(jù)集完成。
預測未知值的結果 - 預測未知輸入數(shù)據(jù)的輸出（現(xiàn)有訓練和測試數(shù)據(jù)除外）
評估模型 - 通過預測測試數(shù)據(jù)的輸出并將預測與測試數(shù)據(jù)的實際結果進行交叉比較來評估模型。
凍結、修改或選擇新算法 - 檢查模型評估是否成功。如果是，請保存算法以備將來預測之用。如果不是，則修改或選擇新的算法/模型，最后再次訓練、預測和評估模型。重復該過程，直到找到最佳算法（模型）。