職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1、負責大模型訓練研發。構建訓練數據集,運用SFT、RLHF等技術對大模型進行微調,滿足大模型領域場景落地需求;
2、負責大模型推理優化。運用prompt工程、模型蒸餾、推理加速、超長上下文等技術,優化大模型性能,提升大模型落地成效;
3、負責大模型安全研究。降低大模型輸出幻覺,提高大模型安全性及穩定性,解決大模型可控可信度不足問題;
4、參與大模型產品化落地,提供大模型產品化、公有云和私有云落地方案。
任職資格:
1、計算機、人工智能等專業,碩士及以上學歷,具備5年以上算法工作經驗;
2、熟練掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等預訓練模型;
3、精通大模型微調、自監督學習、注意力機制、Transformer、多模態學習、模型蒸餾、推理加速等技術;
4、精通Python/C 等編程語言,熟練掌握Pytorch/Tensorflow等深度學習框架、Deepspeed/Megatron等分布式訓練框架;
5、具備優秀的分析問題和解決問題能力,勇于挑戰困難問題;
6、具備良好的團隊協作和溝通能力,能夠帶領團隊達成大模型目標任務;
7、具備超大規模(集群千卡 /大模型100B )訓練、調優經驗者優先;
8、在英文期刊和學術頂會上發表過學術論文者優先。
1、負責大模型訓練研發。構建訓練數據集,運用SFT、RLHF等技術對大模型進行微調,滿足大模型領域場景落地需求;
2、負責大模型推理優化。運用prompt工程、模型蒸餾、推理加速、超長上下文等技術,優化大模型性能,提升大模型落地成效;
3、負責大模型安全研究。降低大模型輸出幻覺,提高大模型安全性及穩定性,解決大模型可控可信度不足問題;
4、參與大模型產品化落地,提供大模型產品化、公有云和私有云落地方案。
任職資格:
1、計算機、人工智能等專業,碩士及以上學歷,具備5年以上算法工作經驗;
2、熟練掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等預訓練模型;
3、精通大模型微調、自監督學習、注意力機制、Transformer、多模態學習、模型蒸餾、推理加速等技術;
4、精通Python/C 等編程語言,熟練掌握Pytorch/Tensorflow等深度學習框架、Deepspeed/Megatron等分布式訓練框架;
5、具備優秀的分析問題和解決問題能力,勇于挑戰困難問題;
6、具備良好的團隊協作和溝通能力,能夠帶領團隊達成大模型目標任務;
7、具備超大規模(集群千卡 /大模型100B )訓練、調優經驗者優先;
8、在英文期刊和學術頂會上發表過學術論文者優先。
工作地點
地址:蘇州虎丘區蘇州市高新區昆侖山路58號


職位發布者
劉女士/..HR
中移(蘇州)軟件技術有限公司

-
通信/電信/網絡設備/增值服務
-
500-999人
-
國有企業
-
虎丘區科靈路78號