
7月17日下午,信息學院邀請香港城市大學宋林琦教授作了題為“基于大語言模型的推理研究”的學術報告。報告由信息學院的劉杰教授主持,信息學院三十余名師生聆聽了此次報告。
宋林琦教授在清華大學獲得電子工程學士和碩士學位,在加州大學洛杉磯分校獲得電氣工程博士學位,他的研究興趣包括信息理論和編碼理論、通信、機器學習和大數據等。
報告中,宋林琦教授詳細介紹了大語言模型在數學推理中的應用,特別是GPT-4代碼解釋器在解決復雜數學問題中的表現。他提出了Explicit Code-based Self-Verification(CSV)方法,通過自動生成和執行代碼、自我調試等手段,顯著提高了模型的推理準確性。宋教授還介紹了他的最新研究成果—MUSTARD框架,這一框架通過結合LLMs的口頭表達和形式定理證明器的數據驗證優勢,生成高質量的數學數據,并在多個實際應用中展示了其有效性。
報告結束后,宋林琦教授回答了與會老師和同學們的提問,與大家展開了熱烈的討論。他分享了自己在研究過程中的經驗和心得,并對未來LLMs在數學推理及其他復雜任務中的應用前景進行了展望。與會老師和同學紛紛表示受益匪淺,對未來的研究工作充滿了新的思考和靈感。
編輯:左芳舟