職位描述
崗位職責:1.負責多語言、多模態(tài)大模型訓練所需的數(shù)據(jù)質(zhì)檢、理解算子,通過構(gòu)建完整的數(shù)據(jù)體系,為大模型的訓練數(shù)據(jù)質(zhì)量負責;2.負責大模型預訓練數(shù)據(jù)獲取和清洗系統(tǒng)性方法研究,通過質(zhì)量/覆蓋/多樣性評估等方法清洗出高質(zhì)量數(shù)據(jù),提升基座模型訓練效果;3.不斷跟進業(yè)界前沿數(shù)據(jù)算法,提高數(shù)據(jù)算法效果和效率,持續(xù)提升模型訓練效果。職位要求:1.熟練掌握CV、音頻、NLP中一個或多個領域,持續(xù)關注行業(yè)動態(tài)和最新技術;2.具備良好的編程能力,熟練掌握Python編程語言及pyTorch框架;3.具備優(yōu)秀的數(shù)據(jù)洞察力、邏輯思維和溝通表達能力,自我驅(qū)動、目標導向、抗壓能力強;4.計算機科學、機器學習、數(shù)據(jù)科學、應用數(shù)學等領域碩士及以上學歷;5.有大模型數(shù)據(jù)、預訓練、后訓練經(jīng)驗者者優(yōu)先。符合京東價值觀:客戶為先、創(chuàng)新、拼搏、擔當、感恩、誠信。
企業(yè)介紹
京東科技集團是京東集團旗下專注于以技術為產(chǎn)業(yè)服務的業(yè)務子集團,致力于為企業(yè)、金融機構(gòu)、政府等客戶提供全價值鏈的技術性產(chǎn)品與解決方案。依托人工智能、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)前沿科技能力,京東科技打造出了面向不同行業(yè)的產(chǎn)品和解決方案,以此幫助全社會各行業(yè)企業(yè)降低供應鏈成本,提升運營效率,成為值得產(chǎn)業(yè)信賴的數(shù)字合作伙伴。融合了原京東數(shù)科及云與AI兩大技術業(yè)務板塊,京東科技現(xiàn)已成為整個京東集團對外提供技術服務的核心輸出平臺,擁有豐富的產(chǎn)業(yè)理解力、深厚的風險管理能力、用戶運營能力和企業(yè)服務能力,能面向不同行業(yè)為客戶提供行業(yè)應用、產(chǎn)品開發(fā)與產(chǎn)業(yè)數(shù)字化服務。截至2020年6月末,在政府及其他客戶服務領域,京東科技服務了超過40家城市公共服務機構(gòu),在全國建立了50多個城市云服務基地,此外也建立了龐大的線下物聯(lián)網(wǎng)營銷平臺,擁有自營和聯(lián)盟媒體點位數(shù)超過1,500萬,覆蓋全國超過300座城市以及6億多人次;在金融機構(gòu)服務領域,京東科技已為包括銀行、保險、基金、信托、證券公司在內(nèi)的超600家各類金融機構(gòu)提供了多層次數(shù)字化解決方案;在商戶與企業(yè)服務領域,已為超100萬家小微商戶、超20萬家中小企業(yè)、超700家大型商業(yè)中心等提供了包括業(yè)務和技術在內(nèi)的數(shù)字化解決方案。目前京東科技擁有1萬多名員工,其中70%以上為研發(fā)和專業(yè)人員,并且擁有多位入選IEEE Fellow的科學家。截止2020年底,集團累計申請專利3540個,在AAAI、IJCAI、CVPR、KDD、NeurIPS、ICML、ACL、ICASSP等國際AI會議上共發(fā)表相關論文近350篇。在人工智能領域,京東科技在語音與聲學、計算機視覺、機器學習、知識圖譜、語義、對話等技術領域不斷深耕,并已在多項國際性學術賽事中斬獲19項世界頭名榮譽,與美國斯坦福大學、中國科技大學等多所國內(nèi)外高校合作建立人工智能實驗室,充分展開產(chǎn)學研一體化實踐。此外,在國際獨立權威調(diào)研機構(gòu)Forrester最新發(fā)布的《中國預測分析與機器學習解決方案廠商評測2020Q4》中,京東科技參評,躋身“不凡表現(xiàn)者”領域,同時京東NeuHub人工智能開放平臺累計調(diào)用量已高達萬億次。在云計算領域,截至目前,京東科技累計建基地及落地城市云超過50個,注冊用戶超過87萬,4萬+企業(yè)用戶,實現(xiàn)100%云上訂單,擁有全球排名前列規(guī)模Docker集群之一和中國排名前列的GPU集群之一。在物聯(lián)網(wǎng)領域,京東科技在2014年率先進行業(yè)務布局并發(fā)布自主研發(fā)、跨品牌、跨品類的智能家居互聯(lián)互通平臺。目前,IoT平臺連接高質(zhì)量設備超2億臺;連接設備品類超230種;品牌超1000家;連接超4000款智能家居設備,交互次數(shù)超過27億;累計服務2600萬家庭。在區(qū)塊鏈領域,京東科技研發(fā)了自主可控、全面開源的底層引擎,并打造了業(yè)界知名的“京東智臻鏈”技術品牌,其中,“智臻鏈防偽追溯平臺”已合作品牌商超1,000 家,落鏈數(shù)據(jù)超10 億級,消費者“品質(zhì)溯源”查詢次數(shù)超750 萬次。依托京東集團整體深厚的生態(tài)平臺與長期積累的技術實力,京東科技參與了多個國家重大科研項目:入選人工智能“國家隊”——科技部國家人工智能開放創(chuàng)新平臺名單,承擔起建設國家“新一代智能供應鏈人工智能開放創(chuàng)新平臺”的重任;牽頭承擔科技部國家重點研發(fā)計劃項目“國家中心城市數(shù)據(jù)管控與知識萃取技術和系統(tǒng)應用”、“國家新區(qū)數(shù)字孿生系統(tǒng)與融合網(wǎng)絡計算體系建設”、工信部公共服務平臺建設項目“面向人工智能創(chuàng)新應用先導區(qū)的應用場景公共服務平臺建設”等多個國家科研項目。京東科技是科技創(chuàng)新與實體產(chǎn)業(yè)深度融合的數(shù)智化企業(yè),它脫胎于對供應鏈的深刻理解和行業(yè)洞察,發(fā)展于對互聯(lián)網(wǎng)技術的突破創(chuàng)新,成長于對實體經(jīng)濟的服務和價值創(chuàng)造。