Apache Beam Java SDK
Apache Beam 的 Java SDK 提供了一個簡單且強大的 API,用於在 Java 中建構批次和串流平行資料處理管線。
開始使用 Java SDK
開始使用 Beam 程式設計模型,以了解適用於 Beam 中所有 SDK 的基本概念。
請參閱 Java API 參考,以取得關於個別 API 的更多資訊。
支援的功能
Java SDK 支援 Beam 模型目前支援的所有功能。
管線 I/O
請參閱 Beam 提供的 I/O 轉換頁面,以取得目前可用的 I/O 轉換清單。
擴充功能
Java SDK 具有以下擴充功能
- join-library 提供內部 Join、外部左 Join 和外部右 Join 函式。
- sorter 是一個高效且可擴展的大型可迭代排序器。
- Nexmark 是一個基準測試套件,可在批次和串流模式下執行。
- TPC-DS 是一個 SQL 基準測試套件,可在批次模式下執行。
- euphoria 是一個易於使用的 Java 8 DSL,適用於 BEAM。
此外,還存在幾個第三方 Java 程式庫。
Java 多語言管線快速入門
Apache Beam 可讓您結合以任何支援的 SDK 語言撰寫的轉換,並在一個多語言管線中使用它們。若要了解如何使用 Java SDK 建立多語言管線,請參閱Java 多語言管線快速入門。