1、基于昇騰計(jì)算的Atlas硬件平臺(tái),搭建開發(fā)和測(cè)試環(huán)境及模型部署(GPU開發(fā)測(cè)試環(huán)境搭建及模型部署)。
2、進(jìn)行Pytorch/Mindspore/Tensorflow模型的遷移、訓(xùn)練和推理調(diào)優(yōu),提升模型性能/精度。
3、負(fù)責(zé)深度學(xué)習(xí)框架中算子的性能分析及替代開發(fā),研究并實(shí)現(xiàn)高效、可擴(kuò)展的融合算子,提升模型的訓(xùn)練和推理效率。
4、熟練使用模型壓縮算法,如量化、剪枝、蒸餾、混合精度訓(xùn)練等,負(fù)責(zé)vllm、tgi等推理框架的適配。
5、熟練掌握大模型全參訓(xùn)練、loar微調(diào)。
6、負(fù)責(zé)模型訓(xùn)練、推理、調(diào)優(yōu)、部署等環(huán)節(jié)技術(shù)問(wèn)題的定位,給出合理的解決方案并推動(dòng)問(wèn)題閉環(huán)。
1、計(jì)算機(jī)專業(yè)或相關(guān)領(lǐng)域?qū)I(yè)畢業(yè),熟悉Python/C/C++語(yǔ)言,有扎實(shí)的代碼開發(fā)經(jīng)驗(yàn)。
2、熟悉至少一種主流深度學(xué)習(xí)框架(如Pytorch/Tensorflow/Mindspore/Caffe等)。
3、有較強(qiáng)的邏輯思維和編程能力,熟悉C/C++/Python等編程語(yǔ)言,了解CUDA或OpenCL等并行計(jì)算平臺(tái)。
4、熟悉CNN、OpenCV、NLP等AI基礎(chǔ)知識(shí),深入理解大模型、多模態(tài)、AIGC的網(wǎng)絡(luò)架構(gòu)。
5、熟悉至少一種AI加速芯片(如英偉達(dá)/昇騰/寒武紀(jì)/昆侖芯/比特大陸/天數(shù)智芯/海光DCU等)
職位類別:
昇騰FAE
舉報(bào)