捕鱼游戏app下载

書名：程序員必會的40種算法
作者名： (加)伊姆蘭·艾哈邁德
本章字數： 4350字
更新時間： 2021-09-27 16:59:57

2.1　Python中的數據結構

在任何編程語言中，數據結構都用于存儲和操作復雜的數據。在Python中，數據結構也是數據存儲容器，用于以有效方式對數據進行管理、組織和查找。它們用于存儲成組出現的數據元素，這些數據元素需要一起存儲和處理，每一組這樣的數據稱為一個集合。在Python中，有五種不同的數據結構可以用來存儲集合：

列表（list）：有序的可變元素序列。
元組（tuple）：有序的不可變元素序列。
集合（set）：無序元素序列（其中元素不重復）。
字典（dictionary）：無序的鍵值對序列。
數據幀（DataFrame）：存儲二維數據的二維結構。

下面我們在更詳細地介紹它們。

2.1.1　列表

在Python中，列表是用來存儲可變元素序列的主要數據結構。列表中存儲的數據元素序列不必是同一數據類型。

要創建一個列表，數據元素需要用[ ]括起來，并且需要用逗號隔開。例如，下面的代碼創建了一個含有四個數據元素的列表，其數據類型不完全相同：

在Python中，列表是一種創建一維可寫數據結構的便捷方法，在算法的不同內部階段都特別有用。

使用列表

數據結構關聯的實用功能非常有用，因為這些功能可以用來管理列表中的數據。

我們看看如何使用列表：

列表索引：由于元素在列表中的位置是確定的，因此可以使用索引來獲取某個特定位置的元素。下面的代碼演示了這個概念：

該代碼創建的四元素列表如圖2-1所示。

圖　2-1

注意，索引從0開始，因此第二個元素Green由索引1即bin_color[1]檢索。

列表切片：通過指定索引范圍可以檢索列表中的元素子集，這個過程叫作切片。下面的代碼可以用來創建列表的一個切片：

注意，列表是Python中非常流行的一維數據結構之一。

007-1a 在對列表進行切片時，其切片范圍如下所示：包含第一個數字而不包含第二個數字。例如，bin_colors[0:2]將包括bin_color[0]和bin_color[1]，而不包括bin_color[2]。在使用列表時應注意這一點，因為Python語言的一些用戶抱怨這不是很直觀。

我們看看下面的代碼片段：

如果未指定起始索引，則意味著起始索引為列表的開始，如果未指定終止索引，則表示終止索引為列表的末尾，前面的代碼實際上已經演示了這個概念。

負索引：在Python中，也有負索引，負索引從列表的末尾開始計數。下面的代碼對此進行了演示：

注意，如果我們想將參考點設置為最后一個元素而不是第一個元素，負索引特別有用。

嵌套：列表的每個元素可以是簡單數據類型，也可以是復雜數據類型，這就允許在列表中進行嵌套。對于迭代和遞歸算法來說，這是非常重要的功能。

讓我們來看看下面的代碼，這是在一個列表中嵌套列表的例子：

迭代：Python允許使用for循環對列表中的每個元素進行迭代，這在下面的例子中進行了演示：

注意，前面的代碼會遍歷列表并打印每個元素。

lambda函數

在列表中可以使用大量的lambda函數。lambda函數在算法中特別重要，其提供了動態創建函數的能力。有時在文獻中，lambda函數也被稱為匿名函數。本小節將展示其用途：

過濾數據：為了過濾數據，需要先定義一個謂詞，說明需要完成什么工作，它是輸入一個參數并返回一個布爾值的函數。下面的代碼演示了它的使用方法：

在這段代碼中，我們使用了lambda函數來過濾一個列表，該函數指定了過濾標準。filter函數旨在依據定義的標準從序列中過濾掉不符合標準的元素。在Python中，filter函數通常與lambda函數一起使用。除了列表之外，它還可以用來從元組或集合中過濾元素。對于前面展示的代碼，定義的過濾標準是x>100，這段代碼將遍歷列表中的所有元素，并過濾掉不符合這個標準的元素。

數據轉換：map()函數可用于通過lambda函數進行數據轉換。示例如下：

將map函數和lambda函數一起使用可以提供相當強大的功能。當與map函數一起使用時，lambda函數可以用來聲明一個轉換器，對給定序列的每個元素進行轉換。在前面展示的代碼中，轉換器是取平方。因此，我們使用map函數對列表中的每個元素求平方。

數據聚合：對于數據聚合，可以使用reduce()函數，該函數會循環運行定義的函數，對列表中每對元素值進行處理：

注意，reduce函數需要定義一個數據聚合函數，前面代碼中的數據聚合函數是doSum，它定義了如何對給定列表中的各項元素進行聚合。聚合從最前面的兩個元素開始，然后用聚合結果替換這兩個元素。這樣，列表元素會減少，該過程不斷重復，直到最后得到一個聚合數字。doSum函數中的x1和x2分別代表了每輪迭代中的兩個數字，doSum則代表了它們聚合的標準。

前面代碼塊所得結果是一個單值（即270）。

range函數

range函數可以用來輕松地生成一個大的數字列表。它用作自動填充列表的數字序列。

range函數使用起來很簡單，使用時只需指定列表中想要的元素個數。在默認情況下，列表中的元素從0開始，并逐漸遞增1：

我們還可以指定結束的數字（不包含）和步長（兩個相鄰元素之間的差值）：

上面的range函數給出從3到29的奇數（不包括結束數字，也就是29）。

列表的時間復雜度

列表的時間復雜度可以使用大O記號來表示，整理如下：

注意，添加單個元素所需的時間與列表的規模無關，而表格中其他操作的復雜度則取決于列表的規模。列表的規模越大，性能受到的影響就越明顯。

2.1.2　元組

第二個可以用于存儲集合的數據結構是元組。與列表相反，元組是不可變的（只讀）數據結構。元組由一些被（）包圍的元素組成。

同列表一樣，元組中的元素可以是不同類型的，元組也允許其元素使用復雜數據類型。因此，元組中也可以包含其他元組，這就提供了一種創建嵌套數據結構的方法。創建嵌套數據結構的能力在迭代和遞歸算法中特別有用。

下面的代碼演示了如何創建元組：

007-1b 在可能的情況下，出于性能考慮，應該優先使用不可變的數據結構（例如元組）而不是可變的數據結構（例如列表）。特別是在處理大數據時，不可變的數據結構比可變的數據結構快得多。這是因為，我們需要為列表具備改變數據元素的能力而付出代價。因此，應該仔細分析是否真的需要這種能力。如果將代碼實現為只讀的元組，則其速度會快很多。

注意，在前面的代碼中，a[2]指的是第三個元素，即一個元組(100,200,300)。a[2][1]指的是這個元組中的第二個元素，也就是200。

元組的時間復雜度

元組的Append函數的時間復雜度總結如下（使用大O記號）：

注意，Append函數是在一個已經存在的元組末尾添加一個元素，其復雜度為O(1)。

注意，元組是不可變的數據類型，其中沒有Append函數。這里所說的Append其實是創建了一個新的元組，具體見如下代碼：

可以看到，我們成功地將新元素添加到元組的末尾，但其實是創建了一個新的元組。

2.1.3　字典

以鍵值對的形式保存數據是非常重要的，尤其是在分布式算法中。在Python中，這些鍵值對的集合被存儲為一個稱為字典的數據結構。要創建一個字典，應該選擇一個在整個數據處理過程中最適合識別數據的屬性作為鍵。值可以是任何類型的元素，例如，數字或字符串。Python總是使用復雜的數據類型（如列表）作為值。如果用字典作為值的數據類型，則可以創建嵌套字典。

為了創建一個為各種變量分配顏色的簡單字典，需要將鍵值對用{ }括起來。例如，下面的代碼創建了一個由三個鍵值對組成的簡單字典：