劉小姐是北京一傳媒集團(tuán)老總的秘書。她工作的一項(xiàng)內(nèi)容是驗(yàn)收員工的培訓(xùn)心得,但隨之而來的網(wǎng)上搜索讓她不勝其苦。
她說,“每次都有上百篇文章交上來,老總要求每篇都在網(wǎng)上搜索一下,看看是不是抄襲的。有時(shí)候,老板自己也親自搜。”上個(gè)月,她查出兩份學(xué)習(xí)心得是一字不改抄襲來的,老板很生氣,當(dāng)即開除了這兩個(gè)經(jīng)營部門的人。
劉小姐覺得,對(duì)每篇文章都上網(wǎng)搜索,工作量比較大。而且,遇到剪刀加漿糊式的抄襲,也不好判斷人家是不是抄的,總不能把每段都拆開去搜。她希望能有個(gè)軟件來自動(dòng)完成這個(gè)工作,“這樣,得罪人的事兒,就不用我來干了。”她從新聞上看到大學(xué)開始使用“反抄襲”軟件檢測(cè)學(xué)生論文時(shí),很感興趣,也去網(wǎng)上注冊(cè)想要使用這個(gè)系統(tǒng),但至今未獲授權(quán)。
與劉小姐一樣想找個(gè)“反抄襲”軟件的,還有出版社的編輯嚴(yán)燕。她主要編輯文學(xué)類小說,“抄名著還好發(fā)現(xiàn),但有些抄襲對(duì)象不是有名作品,我也不可能都看過,不好發(fā)現(xiàn),一旦出版之后會(huì)很被動(dòng)。”她也希望有個(gè)“反抄襲”軟件幫她篩一下書稿,減輕一下工作量。
目前,國內(nèi)的反抄襲軟件主要有兩套:一套是由中國學(xué)術(shù)期刊電子雜志社與清華同方知網(wǎng)共同研制的學(xué)術(shù)不端行為檢測(cè)系統(tǒng),另一套是武漢大學(xué)副教授沈陽研發(fā)的ROST反剽竊系統(tǒng)軟件。這兩套軟件都只對(duì)高等院校和科研單位進(jìn)行檢測(cè)服務(wù),而且免費(fèi),但并不對(duì)公眾開放。
但記者在淘寶網(wǎng)上發(fā)現(xiàn),用這兩種系統(tǒng)提供檢測(cè)服務(wù)的店鋪為數(shù)不少,而且大多生意不壞。在開發(fā)這兩家系統(tǒng)還都免費(fèi)的時(shí)候,已經(jīng)有人從中賺取了“第一桶金”。
“反抄襲”軟件:一天注冊(cè)用戶6000個(gè)
今年年初,全國各大高等院校使用“反抄襲”軟件檢測(cè)畢業(yè)論文的新聞見諸報(bào)端,,“反抄襲”軟件隨后一直處在輿論的風(fēng)口浪尖之上。“現(xiàn)在幾乎天天都有人來找我們,要求授權(quán)他們使用‘學(xué)術(shù)不端行為檢測(cè)系統(tǒng)’。”中國知網(wǎng)科研誠信管理系統(tǒng)研究中心主任孫雄勇告訴中國青年報(bào)記者,“每天大量用戶注冊(cè)申請(qǐng)使用,年初最高峰時(shí),一天注冊(cè)了6000個(gè)用戶。”
孫雄勇說,雖然每天都有大量注冊(cè),但目前開放授權(quán)的,基本都是學(xué)術(shù)科研領(lǐng)域——機(jī)構(gòu)用戶和研究生導(dǎo)師,并且要簽保密協(xié)議。因?yàn)閾?dān)心一旦開放給個(gè)人用戶之后,會(huì)產(chǎn)生不可預(yù)料的后果。
這個(gè)“學(xué)術(shù)不端行為檢測(cè)系統(tǒng)”,是世界首個(gè)用全文文獻(xiàn)為比對(duì)資源檢測(cè)抄襲行為的軟件系統(tǒng),由中國學(xué)術(shù)期刊電子雜志社與同方知網(wǎng)公司聯(lián)合研發(fā)。其耗時(shí)3年,2008年12月底研制成功,2009年3月研究生院開始使用。據(jù)孫雄勇介紹,到6月底,已有3000家期刊編輯部和360多家高校的研究生院在使用,基本上覆蓋了全國重點(diǎn)院校。
雖然用戶很多,但基本都是免費(fèi)使用。因?yàn)檫@樣的用戶,都是知網(wǎng)的論文供應(yīng)商。知網(wǎng)的主營業(yè)務(wù)是數(shù)字出版,主要是通過合法渠道收集論文,再把這些論文整合后打包賣出去,但近年收稿質(zhì)量開始下降,“用戶經(jīng)常投訴論文庫中有重復(fù),編輯部也為此頭疼。所以要求公司開發(fā)一套系統(tǒng)來檢測(cè)。”孫雄勇說。
該系統(tǒng)的技術(shù)核心使用了“自適應(yīng)多階指紋特征檢測(cè)技術(shù)”,能夠防止抄襲中的一些方法,比如替換一些詞句、顛倒順序、重組段落等等。“指紋”是這篇文章的信息特征,簡(jiǎn)單的手段改變不了這些特征。每一次檢測(cè),待檢文章首先按照篇章、段落、句子等層級(jí)分層處理,然后創(chuàng)建指紋,而比對(duì)資源庫中的比對(duì)文獻(xiàn),也采取同樣技術(shù)創(chuàng)建指紋索引,根據(jù)其重合處的比例,判斷該論文是否存在抄襲行為。目前,這個(gè)系統(tǒng)用做比對(duì)的資源庫,是有6000萬條學(xué)術(shù)文獻(xiàn)的數(shù)據(jù)庫及上百億網(wǎng)頁的網(wǎng)絡(luò)資源庫。
Copyright ©1999-2024 chinanews.com. All Rights Reserved