職位描述
崗位職責:1、聚焦強化學習(RL)、模仿學習(IL)、離線強化學習(Offline RL)等方向,構建基于多模態(tài)感知的決策系統(tǒng),開發(fā)從仿真環(huán)境到物理世界的高效遷移學習框架(sim2real),推動機器人復雜操作技能的自主學習與持續(xù)進化。2、對前沿技術工程化落地,構建算法-仿真-硬件閉環(huán)驗證體系,攻克傳感器噪聲補償、動態(tài)環(huán)境感知、機械臂運動學約束等現(xiàn)實場景挑戰(zhàn)。3、研發(fā)機器人操作算法,探索基于Transformer、Diffusion Model、圖神經網絡(GNN)等架構的端到端控制范式,開發(fā)跨模態(tài)表征學習系統(tǒng)(視覺/力覺/觸覺/語音),實現(xiàn)復雜任務的長周期規(guī)劃與柔性操作。4、持續(xù)優(yōu)化工作流程,提升機器人仿真效率和質量。任職要求:1、研究生及以上學歷,計算機、自動化以及人工智能等相關專業(yè)。2、精通Python,熟悉PyTorch,Jax等深度學習框架。3、具有扎實的模仿學習和強化學習領域的與機器人操作的相關的研究經歷,熟悉強化學習的相關框架,如Stable Baselines,rsl-sl等,有sim2real項目或者相關論文者優(yōu)先。4、熟悉常見的機器人仿真軟件,如lsaac-sim、Mujoco等。熟悉3d渲染引擎優(yōu)先,如Blender,Omniverse和Unreal.。5、熟悉3D場景理解(NeRF/Gaussian Splatting)、動態(tài)物體操作(非剛性物體抓?。⒔佑|力學建模等6、部署能力:熟悉ROS2、LCM通信協(xié)議,有TensorRT/OpenVINO部署經驗者優(yōu)先7、有ACT,Diffusion Policy、VLA等端到端算法以及多模態(tài)機器人操作算法研究背景者優(yōu)先。
企業(yè)介紹
天娛數(shù)科(股票代碼:002354.SZ),錨定AI 開拓者定位,致力于為企業(yè)數(shù)字化轉型和智能化升級全面賦能。公司把“數(shù)據要素x”與“人工智能+”結合起來,依托在各類業(yè)務場景中積累的海量數(shù)據要素資源優(yōu)勢和人工智能算法技術優(yōu)勢,自研多個企業(yè)級大模型,構筑了AI 營銷 SaaS、移動應用分發(fā) PaaS、空間智能MaaS 三大業(yè)務平臺,持續(xù)推動零售、工業(yè)、金融、文娛等多個行業(yè)的數(shù)轉智改,形成服務百行千業(yè)萬家企業(yè)客戶的業(yè)務生態(tài)。