(聲明:刊用《中國新聞周刊》稿件務經書面授權)
本刊特約撰稿/凌冰 李渝
國內對學術論文“造假”的監督并非始自今日。2000年3月,上海師范大學法商學院的何云峰教授單槍匹馬地建了一個“好漢網”,豪氣十足地叫板校園里勢頭漸旺的剽竊抄襲等不良學風。
同年,著名“打假斗士”方舟子也創辦了中文學術打假網站“新語絲立此存照”,陸續揭露了500多起學術涉假案例,其中包括“核糖核酸”、清華大學醫學院“劉輝造假事件”等引起廣泛關注的學術造假和腐敗事件。方舟子們的學術打假多通過網友檢舉,并沒有專業的儀器進行技術支撐。
2003年,武漢大學信息管理學院副教授沈陽在國家自然科學基金的資助下,研發了一套與“學位論文學術不端檢測系統”功能相似的系統——ROST反剽竊系統,也稱為“學術不端行為檢測系統”,并于2008年4月研制成功,目前已在全國20多所高校院系推廣和100多家期刊社使用,但沒有大規模推廣。用沈陽的話說,“就像原子彈一樣,它是大規模殺傷性武器,這需要核軍控的”。
在2009年“兩會”前夕,爆出兩起院士涉嫌學術不端行為的事件。6名教授聯名投訴中國工程院院士劉興土涉嫌“抄襲剽竊”。此前不久,浙江大學原副教授賀海波盜用他人研究結果發表多篇論文。賀海波的博士后合作導師、中國工程院院士、浙江大學藥學院院長李連達的名字也出現在這些“問題論文”上。隨后,教育部部長周濟就“賀海波論文造假”事件及處理結果表示,對學術不端行為要像體育界反興奮劑一樣“零容忍”。
2009年3月19日,教育部發出了《關于嚴肅處理高等學校學術不端行為的通知》,這是我國教育部門首次就處理學術不端行為發出通知。通知明確高校對本校有關機構或者個人的學術不端行為的查處負有直接責任,應建立健全處理學術不端行為的工作機構。整個學術界頗有山雨欲來的感覺。
正是在這樣的背景下,由中國學術期刊(光盤版)電子雜志社與清華同方知網共同研制的“學位論文學術不端檢測系統”(簡稱“TMLC”)開始在高校推廣。
檢測的方法涉及一個專業術語——“自適應多階指紋”。什么是信息指紋?沈陽副教授打了個比方,就是每個人說話都有口頭禪,這個口頭禪就是你的一個特征,這個特征就叫信息指紋。具體到一篇文章來說,比如研究金庸小說,金庸喜歡用什么字,用字的規律是多少,每個字在整個文章出現的概率是多少,這就是一個指紋。CNKI科研誠信管理系統研究中心主任孫雄勇向《中國新聞周刊》記者介紹,如果說得通俗一點,就是兩篇文章,如果有一個句子相同,哪怕有一些改寫,都能檢測出來。
“測謊”工具的檢測工作需要強大的后臺數據庫支持,TMLC的后臺是覆蓋了超過5000萬的學術文獻數據庫。
“測謊”技術在目前來說,已經是一個成熟技術了,國外早已廣泛應用于多所高校及科研機構。
在一系列反剽竊網站中,最為出色、應用最廣泛的莫過于“Turnitin”,中文意思是“交上來”,它也是全球第一個檢測剽竊行為的網站。該網站目前已阻止了世界范圍內將近600萬的學生和教育者的剽竊行為,在使用高峰期,每天可收到2萬篇論文。
“Turnitin”通過三個數據庫的內容來檢測交上來的作品:公眾可以查到互聯網上所有存檔的文件(超過45億頁,每天更新4000萬頁);成百萬的已經出版的作品,包括商業數據庫、期刊摘要等,還有上萬本電子書籍,包括古登堡經典文獻收藏;成百萬篇學生交到網站的論文。
在中國,數據庫也在不斷完善之中。不過,“反剽竊”系統要面對的,似乎遠遠不是技術難題。 ★
Copyright ©1999-2024 chinanews.com. All Rights Reserved