Apache Beam 文件
此頁面提供 Beam 程式設計模型、SDK 和執行器的概念資訊和參考資料的連結。
概念
了解 Beam 程式設計模型和所有 Beam SDK 和執行器通用的概念。
- 從 Beam 模型基礎 開始,取得入門概念資訊。
- 閱讀程式設計指南,其中包含有關 Beam 概念的更詳細資訊,並提供程式碼片段。
- 了解 Beam 的執行模型,以更了解管線的執行方式。
- 瀏覽學習資源,查看我們最喜歡的關於 Beam 的文章和演講。
- 參考詞彙表,了解 Beam 程式設計模型的術語。
管線基礎
SDK
尋找所有可用的 Beam SDK 的狀態和參考資訊。
轉換目錄
Beam 的轉換目錄包含 Beam 內建轉換的說明和程式碼片段。
執行器
Beam 執行器會在特定的(通常是分散式)資料處理系統上執行 Beam 管線。
可用的執行器
DirectRunner
在您的機器上本機執行 - 非常適合開發、測試和偵錯。
PrismRunner
在您的機器上本機執行 - 非常適合開發、測試和偵錯。
FlinkRunner
在Apache Flink 上執行。
SparkRunner
在Apache Spark 上執行。
DataflowRunner
在Google Cloud Dataflow 上執行,這是 Google Cloud Platform 中完全受管理的服務。
SamzaRunner
在Apache Samza 上執行。
- JetRunner: 在Hazelcast Jet 上執行。
- Twister2Runner: 在Twister2 上執行。
選擇執行器
Beam 旨在讓管線可以在不同的執行器之間移植。但是,鑑於每個執行器都有不同的功能,它們在實作 Beam 模型中的核心概念時也具有不同的能力。功能矩陣提供了執行器功能的詳細比較。
選擇要使用的執行器之後,請參閱該執行器的頁面,以取得有關任何初始執行器特定設定以及任何用於組態其執行所需的或選用的 PipelineOptions
的詳細資訊。您可能還想參考Java、Python 或 Go 的快速入門,以取得有關執行範例 WordCount 管線的說明。
上次更新於 2024/10/31
您是否找到您要找的所有內容?
所有內容是否有用且清楚?是否有任何您想要變更的地方?請告訴我們!