時間:2023-03-17來源:系統城裝機大師作者:佚名
pandas.merge()是pandas庫中用于合并兩個或多個DataFrame對象的函數,其常用的參數有以下幾個:
示例代碼
1 2 3 4 5 6 7 8 9 |
import pandas as pd # 創建兩個DataFrame df1 = pd.DataFrame({ 'key' : [ 'A' , 'B' , 'C' , 'D' ], 'value' : [ 1 , 2 , 3 , 4 ]}) df2 = pd.DataFrame({ 'key' : [ 'B' , 'D' , 'E' , 'F' ], 'value' : [ 5 , 6 , 7 , 8 ]}) # 通過key列合并兩個DataFrame merged = pd.merge(df1, df2, on = 'key' ) print (merged) |
運行結果:
key value_x value_y
0 B 2 5
1 D 4 6
在這個例子中,創建了兩個DataFrame對象df1和df2,它們都有一個名為’key’的列。使用pd.merge()函數將這兩個DataFrame對象按照’key’列進行合并,并將結果存儲在merged變量中。最后,輸出了合并后的結果,其中value_x和value_y分別代表合并前的df1和df2中的’value’列。
如果只想考慮左側的DataFrame對象,在pandas.merge()函數中可以設置how=‘left’參數來實現。具體來說,how參數控制了兩個DataFrame對象之間的合并方式,可以取值為’left’、‘right’、‘outer’和’inner’。當取值為’left’時,pandas.merge()函數會將左側DataFrame對象中所有的行保留,并在合并后的DataFrame對象中添加右側DataFrame對象中能夠和左側DataFrame對象匹配的行。
下面是一個示例代碼:
1 2 3 4 5 6 7 8 9 10 |
import pandas as pd # 創建兩個DataFrame df1 = pd.DataFrame({ 'key' : [ 'A' , 'B' , 'C' , 'D' ], 'value' : [ 1 , 2 , 3 , 4 ]}) df2 = pd.DataFrame({ 'key' : [ 'B' , 'D' , 'E' , 'F' ], 'value' : [ 5 , 6 , 7 , 8 ]}) # 只考慮左側的DataFrame對象 merged = pd.merge(df1, df2, on = 'key' , how = 'left' ) print (merged) |
運行結果:
key value_x value_y
0 A 1 NaN
1 B 2 5.0
2 C 3 NaN
3 D 4 6.0
在這個例子中,將df1和df2按照’key’列進行合并,并將合并方式設置為’left’。合并結果中包含了df1中所有的行,因為只考慮左側的DataFrame對象。右側的DataFrame對象中’key’列為’E’和’F’的行在合并后的DataFrame對象中的’value_y’列都是NaN。
2023-03-17
python使用openai生成圖像的超詳細教程2023-03-15
pyhon如何把程序打包為whl2023-03-15
python apscheduler cron定時任務觸發接口自動化巡檢過程線程池map()方法傳遞多參數list之前通過threading.thread()進行了助力接口的多線程并發,但是這個針對并發數量較少的時候比較好用,如果并發數量多,除了線程包協程這種處理方式的情...
2023-03-15