近日,以管理學(xué)院數(shù)字化工程管理專業(yè)本科生陳瓊為第一作者的論文PF-SMOTE: A novel parameter-free SMOTE for imbalanced datasets在SCI期刊Neurocomputing(影響因子為5.719)在線發(fā)表,管理學(xué)院張忠良副教授為論文的通訊作者。據(jù)悉Neurocomputing是國際知名期刊,被列為中國科學(xué)院SCI二區(qū)top期刊,CCF-C類期刊。
不均衡數(shù)據(jù)分類任務(wù)是數(shù)據(jù)挖掘領(lǐng)域重要的研究內(nèi)容。SMOTE是處理不均衡數(shù)據(jù)的經(jīng)典方法,受到廣泛關(guān)注,但是傳統(tǒng)的SMOTE及其改進(jìn)方法存在兩方面的不足:一是性能受制于參數(shù)設(shè)置,二是合成樣本代表性不強(qiáng)易產(chǎn)生過擬合現(xiàn)象。為此,該工作設(shè)計了一種新的合成樣本生成方法,該方法不需要任何參數(shù)設(shè)置,也就是具有學(xué)習(xí)任務(wù)自適應(yīng)能力,并且合成的少數(shù)類樣本更具有代表性。大量數(shù)值實驗驗證了該方法的有效性和魯棒性。
“我是從大一上學(xué)期進(jìn)入張老師的本科生科研創(chuàng)新團(tuán)隊的,一開始張老師并沒有給我們安排具體的研究方向,而是做了大量的基礎(chǔ)訓(xùn)練,包括Python和Java編程練習(xí)、數(shù)據(jù)挖掘基礎(chǔ)理論知識學(xué)習(xí)、從底層實現(xiàn)經(jīng)典算法。我們每天都要向張老師匯報總結(jié)當(dāng)天的學(xué)習(xí)情況,每周都有組會討論。這個過程其實挺漫長的,張老師也一直在鼓勵我們,讓我們堅持住?!标惌傉f道,“在算法實現(xiàn)過程中,遇到數(shù)據(jù)異常情況時,張老師反復(fù)強(qiáng)調(diào)一定要做到:異常能定位、錯誤可復(fù)現(xiàn)、問題要解決。張老師非常強(qiáng)調(diào)學(xué)術(shù)規(guī)范,個人的第一篇國際期刊文章尤是如此,一定要保證實驗數(shù)據(jù)的準(zhǔn)確性,為將來開好頭??傊?,挺開心的,論文被接受了,非常感謝管理學(xué)院設(shè)置的導(dǎo)師制,讓我有機(jī)會在本科階段就接觸到科研項目?!?/p>
近年來,管理學(xué)院大力推行本科生科研創(chuàng)新能力培養(yǎng),積極引導(dǎo)本科生科研興趣,已取得了一系列成果。該論文標(biāo)志著管理學(xué)院本科生科研創(chuàng)新能力培養(yǎng)的又一重大突破。