近日,以管理學(xué)院數(shù)字化工程管理專業(yè)本科生陳瓊為第一作者的論文PF-SMOTE: A novel parameter-free SMOTE for imbalanced datasets在SCI期刊Neurocomputing(影響因子為5.719)在線發(fā)表,管理學(xué)院張忠良副教授為論文的通訊作者。據(jù)悉Neurocomputing是國(guó)際知名期刊,被列為中國(guó)科學(xué)院SCI二區(qū)top期刊,CCF-C類期刊。
不均衡數(shù)據(jù)分類任務(wù)是數(shù)據(jù)挖掘領(lǐng)域重要的研究?jī)?nèi)容。SMOTE是處理不均衡數(shù)據(jù)的經(jīng)典方法,受到廣泛關(guān)注,但是傳統(tǒng)的SMOTE及其改進(jìn)方法存在兩方面的不足:一是性能受制于參數(shù)設(shè)置,二是合成樣本代表性不強(qiáng)易產(chǎn)生過擬合現(xiàn)象。為此,該工作設(shè)計(jì)了一種新的合成樣本生成方法,該方法不需要任何參數(shù)設(shè)置,也就是具有學(xué)習(xí)任務(wù)自適應(yīng)能力,并且合成的少數(shù)類樣本更具有代表性。大量數(shù)值實(shí)驗(yàn)驗(yàn)證了該方法的有效性和魯棒性。
“我是從大一上學(xué)期進(jìn)入張老師的本科生科研創(chuàng)新團(tuán)隊(duì)的,一開始張老師并沒有給我們安排具體的研究方向,而是做了大量的基礎(chǔ)訓(xùn)練,包括Python和Java編程練習(xí)、數(shù)據(jù)挖掘基礎(chǔ)理論知識(shí)學(xué)習(xí)、從底層實(shí)現(xiàn)經(jīng)典算法。我們每天都要向張老師匯報(bào)總結(jié)當(dāng)天的學(xué)習(xí)情況,每周都有組會(huì)討論。這個(gè)過程其實(shí)挺漫長(zhǎng)的,張老師也一直在鼓勵(lì)我們,讓我們堅(jiān)持住。”陳瓊說道,“在算法實(shí)現(xiàn)過程中,遇到數(shù)據(jù)異常情況時(shí),張老師反復(fù)強(qiáng)調(diào)一定要做到:異常能定位、錯(cuò)誤可復(fù)現(xiàn)、問題要解決。張老師非常強(qiáng)調(diào)學(xué)術(shù)規(guī)范,個(gè)人的第一篇國(guó)際期刊文章尤是如此,一定要保證實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確性,為將來開好頭。總之,挺開心的,論文被接受了,非常感謝管理學(xué)院設(shè)置的導(dǎo)師制,讓我有機(jī)會(huì)在本科階段就接觸到科研項(xiàng)目。”
近年來,管理學(xué)院大力推行本科生科研創(chuàng)新能力培養(yǎng),積極引導(dǎo)本科生科研興趣,已取得了一系列成果。該論文標(biāo)志著管理學(xué)院本科生科研創(chuàng)新能力培養(yǎng)的又一重大突破。