9月20日上午,信息學(xué)院大規(guī)模流數(shù)據(jù)集成與分析技術(shù)北京市重點實驗室邀請了酷克數(shù)據(jù)首席科學(xué)家楊勝文博士進行了題為“企業(yè)數(shù)據(jù)倉庫加速AI落地:方法、工具及大語言模型應(yīng)用實踐”的學(xué)術(shù)報告和交流。本次報告由實驗室的王桂玲研究員主持,實驗室主任韓燕波教授代表實驗室?guī)熒鷮顒傥牟┦勘硎玖藷崃业臍g迎,信息學(xué)院七十多位同學(xué)參加了此次學(xué)術(shù)活動。

楊勝文博士首先從數(shù)據(jù)平臺技術(shù)的演進過程入手,介紹了傳統(tǒng)技術(shù)中目前存在的問題,繼而引入了一個以HashData為代表的現(xiàn)代企業(yè)數(shù)據(jù)倉庫,并提出了企業(yè)數(shù)據(jù)倉庫和AI技術(shù)結(jié)合的新范式,這使得從數(shù)據(jù)處理、模型訓(xùn)練到智能應(yīng)用開發(fā)變得更加高效。楊博士具體介紹了一個數(shù)據(jù)科學(xué)和AI開發(fā)工具HashML,并從兩個語言模型ReQA和ChatData的具體實踐角度闡述了基于HashML的實際應(yīng)用場景。在演講過程中,楊勝文博士還回答了老師和同學(xué)們的問題,與師生就相關(guān)問題進行了充分地交流和討論,現(xiàn)場氣氛熱烈。

楊勝文博士畢業(yè)于清華大學(xué)計算機系,現(xiàn)任酷克數(shù)據(jù)首席科學(xué)家。曾任百度大數(shù)據(jù)技術(shù)委員會主席、主任架構(gòu)師、大數(shù)據(jù)部技術(shù)負(fù)責(zé)人,更早前在EMC、Yahoo Beijing Labs、HP Labs China從事研發(fā)工作。在大數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)智能等領(lǐng)域深耕多年,在互聯(lián)網(wǎng)用戶理解、產(chǎn)業(yè)數(shù)據(jù)智能、人工智能行業(yè)應(yīng)用等領(lǐng)域有著豐富的實踐經(jīng)驗。獲得2022年度教育部科學(xué)技術(shù)進步獎一等獎。