W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
在上一節(jié)中,我們已經(jīng)學(xué)習(xí)了監(jiān)督和無監(jiān)督機器學(xué)習(xí)算法。 這些算法需要格式化數(shù)據(jù)才能開始訓(xùn)練過程。在這一節(jié)中,我們以某種方式準(zhǔn)備或格式化數(shù)據(jù),以便將其作為 ML 算法的輸入提供。
本章重點介紹機器學(xué)習(xí)算法的數(shù)據(jù)準(zhǔn)備。
在我們的日常生活中,需要處理大量數(shù)據(jù),但這些數(shù)據(jù)是原始數(shù)據(jù)。 為了提供數(shù)據(jù)作為機器學(xué)習(xí)算法的輸入,需要將其轉(zhuǎn)換為有意義的數(shù)據(jù)。 這就是數(shù)據(jù)預(yù)處理進(jìn)入圖像的地方。 換言之,可以說在將數(shù)據(jù)提供給機器學(xué)習(xí)算法之前,我們需要對數(shù)據(jù)進(jìn)行預(yù)處理。
數(shù)據(jù)預(yù)處理步驟
按照以下步驟在 Python 中預(yù)處理數(shù)據(jù) -
第1步 - 導(dǎo)入有用的軟件包 - 如果使用 Python,那么這將成為將數(shù)據(jù)轉(zhuǎn)換為特定格式(即預(yù)處理)的第一步。如下代碼 -
import numpy as np
from sklearn import preprocessing
這里使用了以下兩個軟件包 -
第2步 - 定義樣本數(shù)據(jù) - 導(dǎo)入包后,需要定義一些樣本數(shù)據(jù),以便可以對這些數(shù)據(jù)應(yīng)用預(yù)處理技術(shù)。現(xiàn)在將定義以下樣本數(shù)據(jù) -
input_data = np.array([[2.1, -1.9, 5.5],
[-1.5, 2.4, 3.5],
[0.5, -7.9, 5.6],
[5.9, 2.3, -5.8]])
第3步 - 應(yīng)用預(yù)處理技術(shù) - 在這一步中,我們需要應(yīng)用預(yù)處理技術(shù)。
以下部分描述數(shù)據(jù)預(yù)處理技術(shù)。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: