職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
職位概述:
作為高級數據工程師/ETL工程師,您將在設計、開發和優化數據處理系統方面發揮關鍵作用,以支持組織的數據計劃。您在SQL、大數據和云方面的專業知識對于構建強大的ETL管道至關重要,這些管道將原始數據轉化為可執行的洞察。您將與跨職能團隊合作,確保數據的準確性、可訪問性和決策價值。
職責:
1. 設計與開發ETL流程:
- 使用各類批處理/流式處理工具設計和實施ETL流程,從各種數據源提取、轉換和加載數據到云。
- 與利益相關者協作,收集需求并確保ETL解決方案滿足業務需求。
2. 數據管道優化:
- 優化數據管道的性能、可擴展性和可靠性,確保高效的數據處理工作流。
- 監控并排查ETL流程問題,主動解決瓶頸和故障。
3. 數據集成與管理:
- 集成來自不同來源的數據(包括數據庫、API和平面文件),確保數據質量和一致性。
- 在云中管理和維護數據存儲解決方案(如BigQuery、Cloud Storage),以支持分析和報告。
4.GCP Dataflow開發:
- 編寫基于Apache Beam的Dataflow作業,用于數據提取、轉換和分析,確保***性能和準確性。
- 與數據分析師和數據科學家協作,為分析和報告準備數據。
6. 自動化與監控:
- 使用Apache Airflow或Cloud Composer等工具實現ETL工作流的自動化,提高效率并減少人工干預。
- 設置監控和告警機制,確保數據管道的健康運行并滿足SLA要求。
7. 數據治理與安全:
- 應用數據治理***實踐,確保符合行業法規(如GDPR、HIPAA)和內部政策。
- 與安全團隊合作,實施數據保護措施并解決潛在漏洞。
8. 文檔與知識共享:
- 編寫ETL流程、數據模型和架構文檔,促進知識共享和新團隊成員快速上手。
- 組織培訓和研討會,分享專業知識并在團隊內推廣***實踐。
任職要求:
- 教育背景:
- 計算機科學、信息系統或相關領域的學士學位。
- 經驗:
- 至少5年數據工程或ETL開發行業經驗,重點關注Data Stage和GCP。
- 有設計和實施ETL解決方案的經驗,包括數據建模、數據倉庫和SQL開發。
- 技術技能:
- 熟悉云服務(如BigQuery、Dataflow、Cloud Storage、Pub/Sub)及其在數據工程中的應用。
- 有基于云的解決方案經驗,尤其是GCP,持有云認證者優先。
- 具備批處理和流式處理的大數據經驗,熟悉大數據生態系統(如Hadoop、HBase、Hive、MapReduce、Kafka、Flink、Spark等)。
- 熟悉Java和Python在云/大數據平臺上的數據操作。
- 分析能力:
- 具備出色的解決問題能力和對細節的高度關注。
- 能夠分析復雜數據集并提取有意義的洞察。
作為高級數據工程師/ETL工程師,您將在設計、開發和優化數據處理系統方面發揮關鍵作用,以支持組織的數據計劃。您在SQL、大數據和云方面的專業知識對于構建強大的ETL管道至關重要,這些管道將原始數據轉化為可執行的洞察。您將與跨職能團隊合作,確保數據的準確性、可訪問性和決策價值。
職責:
1. 設計與開發ETL流程:
- 使用各類批處理/流式處理工具設計和實施ETL流程,從各種數據源提取、轉換和加載數據到云。
- 與利益相關者協作,收集需求并確保ETL解決方案滿足業務需求。
2. 數據管道優化:
- 優化數據管道的性能、可擴展性和可靠性,確保高效的數據處理工作流。
- 監控并排查ETL流程問題,主動解決瓶頸和故障。
3. 數據集成與管理:
- 集成來自不同來源的數據(包括數據庫、API和平面文件),確保數據質量和一致性。
- 在云中管理和維護數據存儲解決方案(如BigQuery、Cloud Storage),以支持分析和報告。
4.GCP Dataflow開發:
- 編寫基于Apache Beam的Dataflow作業,用于數據提取、轉換和分析,確保***性能和準確性。
- 與數據分析師和數據科學家協作,為分析和報告準備數據。
6. 自動化與監控:
- 使用Apache Airflow或Cloud Composer等工具實現ETL工作流的自動化,提高效率并減少人工干預。
- 設置監控和告警機制,確保數據管道的健康運行并滿足SLA要求。
7. 數據治理與安全:
- 應用數據治理***實踐,確保符合行業法規(如GDPR、HIPAA)和內部政策。
- 與安全團隊合作,實施數據保護措施并解決潛在漏洞。
8. 文檔與知識共享:
- 編寫ETL流程、數據模型和架構文檔,促進知識共享和新團隊成員快速上手。
- 組織培訓和研討會,分享專業知識并在團隊內推廣***實踐。
任職要求:
- 教育背景:
- 計算機科學、信息系統或相關領域的學士學位。
- 經驗:
- 至少5年數據工程或ETL開發行業經驗,重點關注Data Stage和GCP。
- 有設計和實施ETL解決方案的經驗,包括數據建模、數據倉庫和SQL開發。
- 技術技能:
- 熟悉云服務(如BigQuery、Dataflow、Cloud Storage、Pub/Sub)及其在數據工程中的應用。
- 有基于云的解決方案經驗,尤其是GCP,持有云認證者優先。
- 具備批處理和流式處理的大數據經驗,熟悉大數據生態系統(如Hadoop、HBase、Hive、MapReduce、Kafka、Flink、Spark等)。
- 熟悉Java和Python在云/大數據平臺上的數據操作。
- 分析能力:
- 具備出色的解決問題能力和對細節的高度關注。
- 能夠分析復雜數據集并提取有意義的洞察。
工作地點
地址:廣州天河區平云廣場-A塔


職位發布者
許博HR
中電金信軟件有限公司

-
計算機軟件
-
1000人以上
-
國有企業
-
東升鎮后屯路中關村東升科技園北領地