職位描述
該職位還未進(jìn)行加V認(rèn)證,請仔細(xì)了解后再進(jìn)行投遞!
崗位職責(zé):
1.負(fù)責(zé)大模型訓(xùn)練框架、推理引擎及資源調(diào)度平臺(GPU/Kubernetes 等)的架構(gòu)設(shè)計(jì)與研發(fā),保障系統(tǒng)高效、穩(wěn)定、可擴(kuò)展;
2.與算法團(tuán)隊(duì)深度合作,針對大模型訓(xùn)練/推理場景進(jìn)行算法系統(tǒng)聯(lián)合優(yōu)化,提升訓(xùn)練速度與推理吞吐;
3.主導(dǎo)分布式訓(xùn)練、混合并行、算子優(yōu)化等關(guān)鍵技術(shù)攻關(guān),持續(xù)提升 GPU 利用率并降低計(jì)算成本;
4.跟蹤業(yè)界前沿,開展前瞻性技術(shù)調(diào)研與原型驗(yàn)證,保持實(shí)驗(yàn)室在大模型系統(tǒng)方向的技術(shù)領(lǐng)先;
5.輸出高質(zhì)量技術(shù)文檔和規(guī)范,推動團(tuán)隊(duì)技術(shù)共享與持續(xù)改進(jìn)。
任職要求:
1.精通 Linux 環(huán)境下的 C/C 與 Python 編程;
2.具備以下至少一項(xiàng)經(jīng)驗(yàn):分布式訓(xùn)練、CUDA 算子優(yōu)化、深度學(xué)習(xí)訓(xùn)練/推理框架二次開發(fā)、在線推理服務(wù)、Kubernetes/GPU 集群調(diào)度;
3.具有獨(dú)立解決復(fù)雜系統(tǒng)問題的能力,良好的團(tuán)隊(duì)協(xié)作與溝通能力;
4.強(qiáng)烈的責(zé)任心和自驅(qū)力,優(yōu)秀的學(xué)習(xí)能力;
5.具備規(guī)范的文檔編寫習(xí)慣,能夠及時更新技術(shù)文檔和流程。
加分項(xiàng):
1.深入研究過至少一種深度學(xué)習(xí)框架(TensorFlow / PyTorch / JAX 等)的底層機(jī)制;
2.參與過 10B 級以上大模型訓(xùn)練并進(jìn)行算法或系統(tǒng)調(diào)優(yōu);
3.熟悉云原生 DevOps、容器化技術(shù)及 K8s 生態(tài);
4.具有系統(tǒng)方向(分布式系統(tǒng)、并行計(jì)算、網(wǎng)絡(luò)或存儲等)研究背景且在頂會發(fā)表論文;
5.對 LLM 推理加速與工程落地有豐富經(jīng)驗(yàn)者優(yōu)先。
1.負(fù)責(zé)大模型訓(xùn)練框架、推理引擎及資源調(diào)度平臺(GPU/Kubernetes 等)的架構(gòu)設(shè)計(jì)與研發(fā),保障系統(tǒng)高效、穩(wěn)定、可擴(kuò)展;
2.與算法團(tuán)隊(duì)深度合作,針對大模型訓(xùn)練/推理場景進(jìn)行算法系統(tǒng)聯(lián)合優(yōu)化,提升訓(xùn)練速度與推理吞吐;
3.主導(dǎo)分布式訓(xùn)練、混合并行、算子優(yōu)化等關(guān)鍵技術(shù)攻關(guān),持續(xù)提升 GPU 利用率并降低計(jì)算成本;
4.跟蹤業(yè)界前沿,開展前瞻性技術(shù)調(diào)研與原型驗(yàn)證,保持實(shí)驗(yàn)室在大模型系統(tǒng)方向的技術(shù)領(lǐng)先;
5.輸出高質(zhì)量技術(shù)文檔和規(guī)范,推動團(tuán)隊(duì)技術(shù)共享與持續(xù)改進(jìn)。
任職要求:
1.精通 Linux 環(huán)境下的 C/C 與 Python 編程;
2.具備以下至少一項(xiàng)經(jīng)驗(yàn):分布式訓(xùn)練、CUDA 算子優(yōu)化、深度學(xué)習(xí)訓(xùn)練/推理框架二次開發(fā)、在線推理服務(wù)、Kubernetes/GPU 集群調(diào)度;
3.具有獨(dú)立解決復(fù)雜系統(tǒng)問題的能力,良好的團(tuán)隊(duì)協(xié)作與溝通能力;
4.強(qiáng)烈的責(zé)任心和自驅(qū)力,優(yōu)秀的學(xué)習(xí)能力;
5.具備規(guī)范的文檔編寫習(xí)慣,能夠及時更新技術(shù)文檔和流程。
加分項(xiàng):
1.深入研究過至少一種深度學(xué)習(xí)框架(TensorFlow / PyTorch / JAX 等)的底層機(jī)制;
2.參與過 10B 級以上大模型訓(xùn)練并進(jìn)行算法或系統(tǒng)調(diào)優(yōu);
3.熟悉云原生 DevOps、容器化技術(shù)及 K8s 生態(tài);
4.具有系統(tǒng)方向(分布式系統(tǒng)、并行計(jì)算、網(wǎng)絡(luò)或存儲等)研究背景且在頂會發(fā)表論文;
5.對 LLM 推理加速與工程落地有豐富經(jīng)驗(yàn)者優(yōu)先。
工作地點(diǎn)
地址:蘇州相城區(qū)中荷(蘇州)科技創(chuàng)新港11


職位發(fā)布者
HR
蘇州英格瑪制造外包有限公司

-
中介服務(wù)
-
500-999人
-
私營·民營企業(yè)
-
獅山路22號
相似職位
-
物業(yè)投資拓展經(jīng)理 10000-15000元大渡口區(qū) 3年以上 本科成都市佳兆業(yè)物業(yè)管理有限公司
-
經(jīng)營預(yù)算員 面議大渡口區(qū) 應(yīng)屆畢業(yè)生 不限中冶建工集團(tuán)有限公司
-
供應(yīng)鏈-工藝技術(shù)見習(xí)工程師-重慶 5000-7000元大渡口區(qū) 應(yīng)屆畢業(yè)生 不限杭州海康威視數(shù)字技術(shù)股份有限公司
-
夜班領(lǐng)班/組長 面議大渡口區(qū) 應(yīng)屆畢業(yè)生 不限沃爾瑪(中國)投資有限公司
-
物業(yè)工程領(lǐng)班(南京秦淮) 面議大渡口區(qū) 應(yīng)屆畢業(yè)生 不限深圳天安智慧園區(qū)運(yùn)營有限公司
-
小時工240/天超輕松 面議大渡口區(qū) 應(yīng)屆畢業(yè)生 不限重慶夢然人力資源管理有限公司