一波未平,一波又起,CVPR 2022又被曝出論文抄襲!
這兩天,來自中國的研究團(tuán)隊(duì)發(fā)現(xiàn),自己去年參加ICDAR競賽的idea,竟然被IBM拿去投中了今年的CVPR。
而這件事最諷刺的一點(diǎn)在于,ICDAR 2021正是由IBM自己承辦的。
(資料圖)
目前,作者已經(jīng)將相關(guān)舉證信息發(fā)給了CVPR的Program Chairs。
這件事的熱度還在發(fā)酵。Reddit上的討論熱度即將破千。
然而,挑戰(zhàn)大廠的權(quán)威,又何談容易呢。
下面,讓我們用第一人稱,還原一下原作者的自述。感受一下原作者的憤怒和委屈。
「我叫Xianbiao Qi,在計(jì)算機(jī)視覺領(lǐng)域搞研究已經(jīng)十多年了。我寫這篇博客是為了揭露一起明目張膽的剽竊行為。IBM蘇黎世研究院剽竊了我們的研究?!?/p>
「他們抄的不是文本內(nèi)容,他們抄的是我們辛辛苦苦做出來的idea?!?/p>
Xianbiao Qi所說的論文是「PingAn-VCGroup"s Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML」,于2021年6月上傳至arXiv,合作者有Jiaquan Ye, Xianbiao Qi和Yelin He等人。
此外,代碼也一并進(jìn)行了開源。
論文地址:https://arxiv.org/abs/2105.01848
而抄襲團(tuán)隊(duì)則是來自IBM蘇黎世研究院的Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak和Peter Staar等人。
他們把最精華的點(diǎn)子吃干抹凈帶走,然后把文章改頭換面地發(fā)在了IEEE/CVF計(jì)算機(jī)視覺和模式識(shí)別會(huì)議論文集上。
剽過來的文章名叫「TableFormer: Table Structure Understanding with Transformers」,請(qǐng)大家擦亮慧眼。
論文地址:https://arxiv.org/abs/2203.01017
Xianbiao Qi表示,Nassar等人的文章把我們的整體方法,以及預(yù)處理和后期處理的部分、可視化部分、推理部分、給出的系統(tǒng)解決方案都抄了過去。甚至還有代碼和預(yù)訓(xùn)練模型。
但是,Nassar等人沒什么別的本事,完美包裝卻熟練得很。他們的文章沒有一個(gè)字引用了Xianbiao Qi團(tuán)隊(duì)的文章內(nèi)容。他們以為這樣就能把查重蒙騙過去了。
通俗地講就是,研究生抄襲一般直接抄文字,而這位蘇黎世的博士后更「高級(jí)」——重寫idea。
實(shí)際上,這辦法還真行。Nassar等人的文章確實(shí)沒被判定為抄襲。最后還是其他很多專家發(fā)現(xiàn)了兩篇文章在idea上的雷同,轉(zhuǎn)告給了Xianbiao Qi團(tuán)隊(duì)。
在Reddit上,有不少網(wǎng)友表示支持作者維權(quán),同時(shí)也提醒他在舉證的時(shí)候盡量不要帶有情緒,雖然很難做到。
也有網(wǎng)友指出,現(xiàn)在列出的證據(jù)遠(yuǎn)非決定性的:
這兩個(gè)團(tuán)隊(duì)在同一個(gè)問題上,使用相同的公開數(shù)據(jù),解決方案也有相似之處。但這并不意味著一方抄襲了另一方。
而知乎上對(duì)此的討論也非常熱烈。
事情就是這么個(gè)事情,時(shí)間線還是有必要好好梳理一下的:
2021年4月7日,Xianbiao Qi團(tuán)隊(duì)結(jié)束了ICDAR 2021表格識(shí)別競賽,并取得了第二名的成績。這是由澳大利亞的IBM小組舉辦的。
同年5月5日,團(tuán)隊(duì)在arXiv上發(fā)表了想法的技術(shù)報(bào)告,以及預(yù)印版本。占了個(gè)坑。
兩個(gè)月之后的7月29日,團(tuán)隊(duì)開源了相關(guān)代碼,甚至還在Github上公開了相關(guān)的幻燈片。
2021年9月,團(tuán)隊(duì)發(fā)布了TableMASTER的預(yù)訓(xùn)練模型。11月,繼續(xù)發(fā)布了tablemaster_mmocr的docker環(huán)境。
Xianbiao Qi自嘲道,「我們這個(gè)項(xiàng)目基本等于全裸了,該發(fā)布的全發(fā)布了。但我們發(fā)布是為了造福整個(gè)社區(qū),不是方便你們抄襲來的?!?/p>
年底,來也技術(shù)團(tuán)隊(duì)在「表格識(shí)別方法評(píng)述及來也科技的實(shí)踐」提到了這篇論文:
TableMASTER從一個(gè)非常新穎的角度來解決表格識(shí)別問題,是一次大膽的嘗試,并且效果也是十分出色。PaddleOCR也用相似的思路開源了一個(gè)十分輕量的表格識(shí)別模型,并提供了PubTabNet數(shù)據(jù)集的預(yù)訓(xùn)練模型,略有不同的是paddleTable采用了RARE和GRU而不是MASTER和transformer。
時(shí)間來到2022年3月2日,TableFormer發(fā)布了。
當(dāng)然,Xianbiao Qi憤怒之下沒有喪失冷靜,他列舉了九大證據(jù),實(shí)錘抄襲。
Our methodology, you plagiarize
Our Pre-processing, you plagiarize
Our Post-processing, you plagiarize
Our Inference speedup method,you plagiarize
Our "tricky" work, you even plagiarize
Our text line detection and text line recognition, you plagiarize
Our systematic solution, you plagiarize
Our visualization, you plagiarize
Misleading the audiences in order to not be captured for plagiarism
第一,方法論部分,抄了。
TableFormer直接抄襲了Xianbiao Qi團(tuán)隊(duì)的點(diǎn)子,把文字部分改寫了。
而且關(guān)鍵的圖表也重新畫了一遍。但是核心思想是雷同的。
第二,預(yù)處理階段,抄了。
Nassar等人直接盜用了齊憲標(biāo)團(tuán)隊(duì)的序列長度最大值500,然后悄悄改成了512。其實(shí)為什么改成這個(gè)數(shù)他們自己也不清楚。
第三,后期處理部分,抄了。
Xianbiao Qi的團(tuán)隊(duì)設(shè)計(jì)了三個(gè)巧妙的規(guī)則來處理后期部分。
而抄襲團(tuán)隊(duì)直接根據(jù)Qi的團(tuán)隊(duì)放出的開源代碼,把三個(gè)規(guī)則寫成了9條。
而這些規(guī)則和代碼是Xianbiao Qi的團(tuán)隊(duì)花了好幾周的時(shí)間才完成的。
第四,推理加速方法,抄了。
在推理階段,Xianbiao Qi團(tuán)隊(duì)在之前的論文中提出了一種memory-cache方法。而Nassar等人直接就用了。
Xianbiao Qi表示,「你們真懂是啥意思嗎就用?」
第五,小技巧,居然也抄了。
第六,文本行檢測和文本行識(shí)別,抄了。
Xianbiao Qi團(tuán)隊(duì)訓(xùn)練文本行檢測和識(shí)別的過程,Nassar等人直接抄了。
第七,系統(tǒng)化解決方案,抄了。
兩邊的處理過程完全一樣,不可能完全是巧合。
第八,可視化部分,抄了。
可以看到,可視化的圖標(biāo)部分,Nassar等人只是換了個(gè)顏色。
第九,用各種手段誤導(dǎo)讀者,避免因?yàn)樨飧`被抓到。
最后,作者表示這次學(xué)到的最深刻的教訓(xùn)就是:「即使開源了代碼,也不要開源自己訓(xùn)練好的模型?!?/p>
參考資料:
https://www.zhihu.com/question/539137931/answer/2542178330
https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/
關(guān)鍵詞: 解決方案 計(jì)算機(jī)視覺 后期處理