作者:劉如楠 來源:中國科學報
「論文工廠」的冰山到底有多大?
自2020年起追蹤以來,著名學術「偵探」Elisabeth
Bik團隊至今已經發現了16個「論文工廠」及其生產的2000多篇論文,絕大多數含有中國作者,這些「學術垃圾」被貼在同行評議網站Pubpeer上。
被舉報后,部分期刊會選擇撤稿。暨南大學學報副主編王景周對526篇撤回論文的分析發現,這些論文來自20家國際出版商的54種期刊,署名都有中國作者,且集中在基礎生命科學和健康科學領域。日前,這一結果以「因『論文工廠』撤回論文的特徵分佈及治理路徑」為題發表在《中國科技期刊研究》上。
Elisabeth Bik團隊成員扮虎告訴《中國科學報》,「國內的論文工廠100%是中國客戶,國外的論文工廠有一部分也是中國客戶,從全世界來看,最大的買家無疑來自中國。」
扮虎還表示,通過參考文獻、圖表構圖配色、郵箱地址、共同作者等,「偵探」們摸索出了多種辦法讓造假者「現原形」。
王景周告訴《中國科學報》,「與國際期刊上出現的工廠論文相比,國內期刊以小作坊論文居多,隱蔽性更強、服務更精準。」他曾通過維普資料庫的「作者簡介」查詢項,追蹤到了同一個中介在2013—2020年間代理髮表的62篇論文。
以下是《中國科學報》與上述兩位專家的對話。
「工廠論文:2020以來集中撤稿,中國作者、生命科學領域佔比大
《中國科學報》:通過研究或追蹤,你發現「論文工廠」論文呈現哪些特徵?
王景周:分析撤稿觀察資料庫(Retraction Watch Database)中的526篇論文工廠論文(截至2021年7月31日)發現,其發表時間集中在2017-2019年(占80.42%),撤回時間集中在2020—2021年(占98.67%)。其中400多篇的撤稿原因都是「第三方指控」,也就是除作者、期刊之外的第三方舉報。
第一作者來自國內29個省/市,出現次數最多的省份是山東省(155篇,29.47%),其次為河南省和吉林省。
進一步分析其機構發現,出現次數最多的是吉林大學(57篇,占10.84%),其次為青島大學和中南大學。
就其學科分佈而言,集中在基礎生命科學和健康科學領域。
需要指出的是,這些分析僅基於來自撤稿觀察的部分論文進行,數據和結論都存在局限性。
扮虎:80%涉及中國作者的撤稿論文是我們團隊直接或間接推動的。自2020年以來,我們的打擊力度很大,比如上周,團隊中最多的一名成員貼出了100多篇造假論文。因此,論文工廠會更隱秘,造假方式也會隨之改變。
與2020年相比,目前挖出的數量已經有所減少,但可以肯定的是,還有大量的工廠論文沒有被挖出來。
《中國科學報》:是由於生命科學、醫學領域產出的工廠論文更多?還是由於學術打假人更關注該領域呢?
扮虎:與其它領域相比,我們沒有更關注生命科學和醫學領域。事實上它的造假確實比其它領域更多,我認為跟醫生的晉陞需要有關。
如果在高校、科研院所做生命科學基礎科研,會把論文成果產出作為評價指標之一,肯定不會要求看多少個病人。那臨床醫生為什麼一定要發論文才能晉陞呢?
當然,我並不是說由於這樣的要求,醫生就可以找論文工廠。而是這樣的評價方式非常不合理。
「虛假註冊、換稿、換名,論文工廠造假伎倆多
《中國科學報》:論文工廠有什麼投稿伎倆嗎?
王景周:比論文工廠存在更久的是代寫、代投。早些年很多人認為代投不屬於學術不端行為,畢竟內容都是自己的,只是找人幫忙發出去;再比如導師讓研究生代投稿件,過去這是很正常的。
近些年來,論文工廠將二者合併,一條龍服務,這就避免了買來論文之後沒有期刊接收的風險。
這些論文工廠的伎倆五花八門:比如與掠奪性期刊合作,利用信息不對稱,謊稱期刊由專業編輯、同行評議、高影響因子等信息,實則以獲利為目的。
再如操縱同行評議,他們會利用虛假信息進行註冊,投稿時推薦這些虛假審稿人,使稿件回到自己郵箱里提供審稿意見。
或者先投一篇質量較高的文章,投中之後,利用編輯處理稿件過程中的漏洞,更換文章;或者投中之後再拿去賣,更換、增加作者;此外,還有最近出現的操縱專刊等等。
《中國科學報》:目前被揭露的工廠論文大多來自國際期刊,國內期刊的情況怎麼樣?
王景周:由於國內沒有如Pubpeer、撤稿觀察等公開集納的平台,缺乏相關數據,某一家期刊的情況可能不具有代表性。
就我們學報而言,與國際期刊流水線式、批量生產的工廠論文不同,遇見的更多是隱蔽性更強、服務更精準的論文「作坊」,也就是「中介論文」。國內期刊中更多的可能是這類型的,成功率更高。
在稿件處理過程中,我就曾發現中介論文的共同手機號碼和郵箱,僅通過維普資料庫的「作者簡介」查詢項,就追蹤到了同一個中介2013—2020年代理發表的62篇論文。
「捉住每一個可疑之處,尋找工廠論文的蛛絲馬跡
《中國科學報》:學術「偵探」們通常如何捕捉工廠論文?根據哪些蛛絲馬跡?
扮虎:一是根據參考文獻。最近這段時間抓出了很多,像引用與主題毫不相關的文獻,引用同一批文獻等等,這些文獻有的是同一家工廠出產的,有的是和期刊的客座編輯聯手來推動某些人的引用率,有些像買熱搜;
二是根據圖片構圖、圖表配色、數據等。我們團隊有的成員對構圖配色非常敏感,根據構圖和配色找到很多可疑的論文,通過團隊間的討論,發現其中絕大多數是有問題的。來自同一家工廠的構圖往往很相似,圖表都是同一種風格。比如有一個工廠,所有的論文都是先從臨床取一些組織樣本,之後植入動物,樣本數量相差都不大,且不同論文培養的是不同細胞,但是圖卻相差無幾;
三是根據郵箱地址。發現一篇論文不對勁,我們會去搜索作者的郵箱,往往不會搜出很多,但很多作者的郵箱是有規律性的,比如都是張三66@163.com,李四88@126.com這種,起初團隊的成員很好奇,還問我66、88在中文裡的特殊含義。如果用的是單位郵箱,當發現一篇可疑論文後,我們通常會翻閱相關聯的組裡所有的論文,往往有很多意想不到的收穫,有時能翻出好幾十篇,通訊作者包括國內的大咖;
四是通過Pubpeer上的回復。我們掛到Pubpeer上之後,所謂的「作者」會來回復,為自己辯解等等,我們發現其回復的語氣都是一樣的,所犯的語法錯誤也是一樣的,但這些作者之間又是毫無關聯的人,這肯定就是論文工廠的客服了。我還遇到用過一位作者的賬號對另一位作者的論文進行回復的情況,估計是忘記切換賬號了,且不止一次;
五是根據作者單位、地域等。我們一方面為了避免誤判,也為了順藤摸瓜,確定了問題論文之後,我們也會再次搜索共同作者之間的關係,比如一個吉林的,一個雲南的,個人簡介中又沒有顯示他曾經與對方有合作,可能就是合作買了同一篇論文。
《中國科學報》:打擊論文工廠的過程中,有哪些令你印象深刻的案例?
扮虎:有次我發現一篇論文,共同作者中只有一個中國人,其他作者都來自中東國家,搜索之後發現這個中國作者的單位是個很小的醫學院,且她過往經歷顯示一直待在教學崗,且論文內容和她的主要方向還不一致,種種奇怪的組合。
那像這樣的人,怎麼會有相關的國際合作呢?國際合作的經費從哪裡來呢?後來我們就深挖下去,就挖出了一個伊朗的實驗室,可能是這個伊朗實驗室在賣論文,輾轉賣到了這位作者手裡。
去年我們發現了一個大型數學論文工廠,其中的17個外國作者甚至是被捏造出來的,根本不存在,這些作者出現在23篇和中國作者合作的論文里。被用的最多的是一位叫Beatriz
Ychussie的虛假丹麥學者,涉及4篇論文。
最近我們剛發現的一個論文工廠,有457篇論文入列,包括國內Top2高校的附屬醫院。像這樣的案例還有很多,往往是拔出蘿蔔帶出泥。
所以我們在打假過程中,一旦遇到新的造假類型或者批次,都會立即新建一個資料庫,比如近來出現的專刊造假,比如同一工廠的論文等。
《中國科學報》:為什麼做學術「偵探」,你從中收獲了什麼?
扮虎:我們團隊大部分人都有科研主業,完全利用業餘時間進行打假,也沒有人給補助。
但大家為什麼還要做這樣的事?因為這些論文造成的後果太嚴重了,後來的科研人員是在這些論文的基礎上繼續研究的,他們會把這些結果當真,那基於這些工廠製造出來的數據和結論,怎麼可能做得出來?何談重大突破呢?
目前確實有不少期刊,從2019年開始對中國作者的論文另眼相待,有的會要求,中國作者的論文必須先提供原始數據,不然都不會送審,直接退稿。
論文工廠在暗處,被我們揪出來之後,他們也可能改頭換面再出來作亂,我們的力量還是非常有限的,這也是需要中國政府重拳出擊的地方。
有人說我們團隊只針對中國,其實是由於大家在國內,更關注國內的情況而已。
中國的打假只佔團隊工作的1/3左右。團隊中實名成員遭受到了很多恐嚇和報復,包括一些國際著名公司,因為科研論文是公司產品的基礎。
就國內而言,也有很多我們惹不起的人。當了解了這些真實情況,有時候覺得很絕望,到底中國還有多少論文可以讓人相信?
也是基於這些,我只能匿名,以保證這項工作能繼續下去。
(文中扮虎為化名)