部落格 & 發佈
2023/05/10
Apache Beam 2.47.0
我們很高興推出 Beam 的 2.47.0 新版本。此版本包含改進和新功能。請參閱下載頁面以取得此版本。
如需更多關於 2.47.0 版本變更的資訊,請查看詳細發佈說明。
重點
- Apache Beam 新增了 Python 3.11 支援 (#23848)。
I/O
- BigQuery Storage Write API 現在可透過跨語言在 Python SDK 中使用 (#21961)。
- 新增了 HbaseIO 支援,可將 RowMutations(依 rowkey 排序)寫入 Hbase (Java) (#25830)。
- 新增了 fileio 轉換 MatchFiles、MatchAll 和 ReadMatches (Go) (#25779)。
- 新增了 JmsIO 的整合測試 + 修復多個連線的問題 (Java) (#25887)。
新功能 / 改進
- Flink 執行器現在支援 Flink 1.16.x (#25046)。
- 現在可以直接將 Schema’d PTransforms 套用至 Beam 資料框,就像 PCollections 一樣。(請注意,當執行多個操作時,明確地串連操作 (如 `df | (Transform1 | Transform2 | ...)`) 可能更有效率,以避免過多的轉換。)
- Go SDK 新增了轉換 periodic.Impulse 和 periodic.Sequence,擴展了對緩慢更新的側輸入模式的支援。(#23106)
- Python SDK 相依性鏈中的幾個 Google 用戶端程式庫已更新至最新的主要版本。(#24599)
重大變更
- 如果主要階段無法載入,管道現在將在 worker 啟動時失敗。(#25401)。
- Python 管道選項現在將忽略以單一破折號開頭的未剖析命令列旗標。(#25943)。
- SmallestPerKey combiner 現在需要僅限關鍵字的引數,以指定選用參數,例如 `key` 和 `reverse`。(#25888)。
已棄用
錯誤修復
- 在批次管道中處於 STORAGE_WRITE_API 模式的 BigQuery sink 在處理 Beam SDK 2.35.0 - 2.46.0(含)的其他不相關的暫時性錯誤期間,可能會導致資料一致性問題。如需更多詳細資訊,請參閱:https://github.com/apache/beam/issues/26521
已知問題
- BigQueryIO Storage API 使用 autoUpdateSchema 寫入可能會導致 Beam SDK 2.45.0 - 2.47.0(含)的資料損毀 (#26789)
- 長時間執行的 Python 管道可能會遇到記憶體洩漏:#28246。
貢獻者清單
根據 git shortlog,以下人員為 2.47.0 版本做出了貢獻。感謝所有貢獻者!
Ahmed Abualsaud
Ahmet Altay
Alexey Romanenko
Amir Fayazi
Amrane Ait Zeouay
Anand Inguva
Andrew Pilloud
Andrey Kot
Bjorn Pedersen
Bruno Volpato
Buqian Zheng
Chamikara Jayalath
ChangyuLi28
Damon
Danny McCormick
Dmitry Repin
George Ma
Jack Dingilian
Jack McCluskey
Jasper Van den Bossche
Jeremy Edwards
Jiangjie (Becket) Qin
Johanna Öjeling
Juta Staes
Kenneth Knowles
Kyle Weaver
Mattie Fu
Moritz Mack
Nick Li
Oleh Borysevych
Pablo Estrada
Rebecca Szper
Reuven Lax
Reza Rokni
Ritesh Ghorse
Robert Bradshaw
Robert Burke
Saadat Su
Saifuddin53
Sam Rohde
Shubham Krishna
Svetak Sundhar
Theodore Ni
Thomas Gaddy
Timur Sultanov
Udi Meiri
Valentyn Tymofieiev
Xinyu Liu
Yanan Hao
Yi Hu
Yuvi Panda
andres-vv
bochap
dannikay
darshan-sj
dependabot[bot]
harrisonlimh
hnnsgstfssn
jrmccluskey
liferoad
tvalentyn
xianhualiu
zhangskz