国产色色,国产亚洲播放在线一区,国产亚洲欧美日韩综合一区二区

Pandas教程：Python數(shù)據(jù)框架的10個(gè)常見(jiàn)問(wèn)題

翻譯|使用教程|編輯：鮑佳佳|2021-03-04 10:40:31.320|閱讀 134 次

概述：當(dāng)您開(kāi)始使用Python進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)科學(xué)時(shí)，Pandas是您將學(xué)習(xí)的第一個(gè)庫(kù)之一。其可幫助您處理數(shù)據(jù)集，轉(zhuǎn)換和清理數(shù)據(jù)以及獲取統(tǒng)計(jì)信息。在本教程中，我們將回答人們?cè)谑褂眯茇垥r(shí)遇到的10個(gè)最常見(jiàn)的問(wèn)題。

# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>

相關(guān)鏈接：

PyCharm是一種Python IDE，其帶有一整套可以幫助用戶在使用Python語(yǔ)言開(kāi)發(fā)時(shí)提高其效率的工具。此外，該IDE提供了一些高級(jí)功能，以用于Django框架下的專業(yè)Web開(kāi)發(fā)。PyCharm現(xiàn)已加入在線訂購(gòu)，點(diǎn)擊此處了解價(jià)格詳情。

點(diǎn)擊下載PyCharm最新試用版

Pandas教程：Python數(shù)據(jù)框架的10個(gè)常見(jiàn)問(wèn)題

當(dāng)您開(kāi)始使用Python進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)科學(xué)時(shí)，Pandas是您將學(xué)習(xí)的第一個(gè)庫(kù)之一。其可幫助您處理數(shù)據(jù)集，轉(zhuǎn)換和清理數(shù)據(jù)以及獲取統(tǒng)計(jì)信息。

Pandas教程：有關(guān)Python數(shù)據(jù)幀的10個(gè)常見(jiàn)問(wèn)題

在本教程中，我們將回答人們?cè)谑褂眯茇垥r(shí)遇到的10個(gè)最常見(jiàn)的問(wèn)題。

數(shù)據(jù)集

在本教程的第一部分中，我們將使用包含城市人口樣本數(shù)據(jù)以及有關(guān)土地面積和人口密度的一些信息的數(shù)據(jù)集。

Pandas Loc和iloc

pandas.loc[] 有助于通過(guò)標(biāo)簽或布爾數(shù)組切片訪問(wèn)一組行和列。

讓我們選擇墨西哥城的人口。

下面我們僅打印墨西哥城的人口。

使用，.iloc[]您可以使用數(shù)字整數(shù)索引選擇列。

請(qǐng)記住以下幾點(diǎn)：

平原:用于選擇行/列中的所有數(shù)據(jù)。
0:2 將選擇行/列0和1。不包括2。
-1 將選擇最后一個(gè)元素。

重命名列

接下來(lái)，我們將重命名這些列，以使它們將來(lái)更易于訪問(wèn)。

有幾種方法可以做到這一點(diǎn)：

直接分配df.columns一個(gè)列名稱數(shù)組。
用df.rename重命名特定列。

在pandas DataFrame中選擇多個(gè)列

讓我們將DataFrame分為兩個(gè)包含以下內(nèi)容的DataFrame：

城市，國(guó)家和人口。
城市，區(qū)域和密度。

我們可以通過(guò)幾種方式做到這一點(diǎn)：

通過(guò)使用.iloc[:, 0:3]，其中括號(hào)中的第一個(gè)參數(shù)選擇所有行，第二個(gè)參數(shù)選擇列0，列1和列2。
通過(guò)將DataFrame切片為double[]并輸入要選擇的列名。

熊貓按列合并兩個(gè)表

接下來(lái)，我們將垂直連接我們創(chuàng)建的兩個(gè)表。這些表具有相同的City列，因此我們將使用該pd.merge函數(shù)來(lái)連接兩個(gè)表。

該left_on和right_on參數(shù)指示列名在第一和第二個(gè)表合并上。

使用pandas更改pandas中的列類型

與數(shù)據(jù)幀的工作進(jìn)一步，我們需要轉(zhuǎn)變Population，Area以及Density從字符串列轉(zhuǎn)換為數(shù)字。

為此，我們將：

創(chuàng)建一個(gè)函數(shù)，to_int()它將帶有'，'符號(hào)的字符串轉(zhuǎn)換為整數(shù)。
將apply函數(shù)與lambda表達(dá)式一起使用。

分組并變成一個(gè)DataFrame

現(xiàn)在，讓我們對(duì)DataFrame進(jìn)行分組，Country并計(jì)算此數(shù)據(jù)樣本中每個(gè)國(guó)家/地區(qū)的人口。
困難之pd.groupby處在于它返回一個(gè)groupby對(duì)象，而不是DataFrame。在下面的示例中，我們將展示如何從groupby對(duì)象創(chuàng)建DataFrame。

我們將對(duì)進(jìn)行分組Country，同時(shí)計(jì)算Population和Area列的總和。我們將刪除密度列，因?yàn)槲覀儾辉傩枰?