ParDo

Pydoc Pydoc




用於一般平行處理的轉換。ParDo 轉換會考慮輸入 PCollection 中的每個元素,對該元素執行一些處理函數 (您的使用者程式碼),並將零或多個元素發射到輸出 PCollection

請參閱 Beam 程式設計指南以了解更多資訊。

範例

在以下範例中,我們將探索如何建立自訂 DoFn 並存取時間戳記和視窗資訊。

範例 1:使用簡單 DoFn 的 ParDo

以下範例定義了一個簡單的 DoFn 類別,名為 SplitWords,它將 delimiter 儲存為物件欄位。process 方法會針對每個元素呼叫一次,並且可以產生零或多個輸出元素。

範例 2:具有時間戳記和視窗資訊的 ParDo

在此範例中,我們將新參數新增至 process 方法,以便在執行時間繫結參數值。

範例 3:具有 DoFn 方法的 ParDo

DoFn 可以使用許多方法自訂,這些方法可以協助建立更複雜的行為。您可以使用 setupteardown 自訂 worker 在啟動和關閉時所執行的動作。您也可以自訂在元素套件開始和完成時所執行的動作,使用 start_bundlefinish_bundle

已知問題

Pydoc Pydoc