方向一:大模型,有l(wèi)lm訓(xùn)練經(jīng)驗(yàn),有強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn),有MCTS,RL,RLHF,PPO,DPO,Reward Model經(jīng)驗(yàn)加分
方向二:文生圖,Stable difussion模型,ComfyUI等框架使用經(jīng)驗(yàn)豐富
方向三:訓(xùn)練過(guò)語(yǔ)音大模型,會(huì)transformer,有Encoder,Decoder,Encodec,Helium,RVQ經(jīng)驗(yàn)加分
工作職責(zé):
1、負(fù)責(zé)多模態(tài)大模型的微調(diào)
2、探索并實(shí)現(xiàn)多模態(tài)大模型的模態(tài)對(duì)齊、高效訓(xùn)練、指令微調(diào)及性能評(píng)估等關(guān)鍵技術(shù)
1、全球知名高校碩士、博士學(xué)歷,有扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ),有較強(qiáng)的實(shí)踐能力
2、熟練掌握pytorch,transformer等LLM 領(lǐng)域相關(guān)工具,有bert,vision-transformer,llm實(shí)踐經(jīng)驗(yàn);有強(qiáng)化學(xué)習(xí)、MCTS、RL、RLHF等經(jīng)驗(yàn)
3、熟悉和實(shí)踐深度學(xué)習(xí)算法(vision-transformer,LLAMA,GPT系列等),發(fā)表過(guò)頂級(jí)期刊或會(huì)議論文優(yōu)先,如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等;有競(jìng)賽經(jīng)驗(yàn)者優(yōu)先。
4、有強(qiáng)烈的求知欲、好奇心和進(jìn)取心,有快速學(xué)習(xí)新技術(shù)的能力
職位類別:
多模態(tài)算法/實(shí)習(xí)生
舉報(bào)