學習資源

歡迎來到我們的學習資源。此頁面包含一系列資源,可協助您開始使用 Apache Beam。如果您剛開始,您可以將此視為導覽,否則您可以直接跳到您感興趣的任何章節。

如果您有其他希望在此處看到的資料,請透過 user@beam.apache.org 告知我們!

開始使用

快速入門

學習基礎知識

基本原理

常見模式

文章

資料分析

資料移轉

機器學習

進階概念

影片

課程

書籍

使用 Apache Beam 建構大數據管線

使用 Apache Beam 建構大數據管線,作者:Jan Lukavský,Packt 出版。(2022 年 1 月)。本書概述 Apache Beam 模型,包含逐步建構的範例,有助於紮實理解主題。第一部分使用 Java SDK 解釋概念,接著介紹 SQL DSL 和以 Python SDK 為重點的可移植層。本書最後一部分專注於更進階的主題,例如使用 Splittable DoFn 的 IO 連接器,以及典型執行器如何執行管線的說明。

串流系統:大規模資料處理的內容、位置、時間和方式

串流系統:大規模資料處理的 What、Where、When 和 How,作者:Tyler Akidau、Slava Chernyak、Reuven Lax。(2018 年 8 月)。本書擴展自 Tyler Akidau 熱門的部落格文章「串流 101」和「串流 102」,將您從入門級帶到對即時資料串流處理的 what、where、when 和 how 有細緻的理解。

認證

開始使用 Apache Beam Quest

開始使用 Apache Beam 這個任務包含四個實驗室,教您如何編寫和測試 Apache Beam 管線。其中三個實驗室使用 Java,一個使用 Python。每個實驗室大約需要 1.5 小時完成。完成任務後,您將獲得一枚徽章,可用於展示您的 Beam 專業知識。

互動式實驗室

Java

Python

Beam Katas

Beam Katas 是互動式的 Beam 程式碼練習(即 程式碼卡塔),可以幫助您親身體驗學習 Apache Beam 的概念和程式設計模型。Beam Katas 基於 JetBrains 教育產品構建,目標是為學習者提供一系列結構化的實作學習體驗,透過解決複雜度逐漸增加的練習,了解 Apache Beam 及其 SDK。Beam Katas 提供 Java 和 Python SDK 兩種版本。

Java

Python

程式碼範例

Dataflow 食譜

食譜包含 Java、Python 和 Scala (透過 Scio) 的範例,提供隨時可啟動且獨立的 Beam 管線。

Java

Python

Beam Playground

API 參考

意見回饋與建議

我們樂於接收回饋和建議,您可以在聯絡我們頁面找到各種聯繫社群的方式。

如果您有錯誤報告或想建議新功能,您可以提交新的 issue來告知我們。

如何貢獻

我們歡迎所有人的貢獻!若要深入了解如何貢獻,請參閱我們的貢獻指南