Go 的 WordCount 快速入門
此快速入門將引導您執行您的第一個 Beam 管道,以在您選擇的執行器上執行使用 Beam 的 Go SDK 撰寫的 WordCount。
如果您有興趣為 Apache Beam Go 程式碼庫貢獻,請參閱貢獻指南。
設定您的環境
Beam SDK for Go 需要 go
1.20 或更新版本。可以從這裡下載。執行以下命令來檢查您擁有的 go 版本
如果您不熟悉 Go,請參閱Go 入門教學。
執行 wordcount
Apache Beam 範例目錄中有許多範例。所有範例都可以通過傳遞範例中描述的必要參數來執行。
例如,要執行 wordcount
,請執行
go run github.com/apache/beam/sdks/v2/go/examples/wordcount@latest --input gs://dataflow-samples/shakespeare/kinglear.txt \
--output gs://<your-gcs-bucket>/counts \
--runner dataflow \
--project your-gcp-project \
--region your-gcp-region \
--temp_location gs://<your-gcs-bucket>/tmp/ \
--staging_location gs://<your-gcs-bucket>/binaries/
# Build and run the Spark job server from Beam source.
# -PsparkMasterUrl is optional. If it is unset the job will be run inside an embedded Spark cluster.
./gradlew :runners:spark:3:job-server:runShadow -PsparkMasterUrl=spark://127.0.0.1:7077
# In a separate terminal, run:
go run github.com/apache/beam/sdks/v2/go/examples/wordcount@latest --input <PATH_TO_INPUT_FILE> \
--output counts \
--runner spark \
--endpoint localhost:8099
下一步
- 瞭解更多關於Beam SDK for Go 的資訊,並瀏覽godoc。
- 請在WordCount 範例演練中逐步了解這些 WordCount 範例。
- 複製 Beam Go 起始專案。
- 透過我們的學習資源進行自學導覽。
- 深入研究我們精選的一些影片和 Podcast。
- 加入 Beam users@ 郵件列表。
如果您遇到任何問題,請隨時與我們聯繫!
上次更新於 2024/10/31
您是否找到了您想要的所有資訊?
所有資訊是否都有用且清楚?您想要更改任何內容嗎?請告訴我們!