量化評價扼殺人文學(xué)術(shù)

目前中國的學(xué)術(shù)評價機制不僅混亂，而且對學(xué)術(shù)研究的發(fā)展極為不利，對人文學(xué)科尤其不利。造成中國學(xué)術(shù)評價機制混亂的原因很多，其中之一是因為急功近利以及學(xué)術(shù)大躍進，使得科研行政管理部門過多干預(yù)學(xué)術(shù)，在學(xué)術(shù)管理上甚至是亂作為。社會上各種各樣的大學(xué)排名、學(xué)科排名以及五花八門的課題申請及評獎活動等，更是將這種不合理的評價機制推向極致。另外一個非常重要的原因，是學(xué)術(shù)界包括期刊同行自身對學(xué)術(shù)評價漠不關(guān)心。很多學(xué)者盡管對目前的學(xué)術(shù)評價機制頗多微詞，但又不愿花更多精力來關(guān)注，結(jié)果導(dǎo)致學(xué)術(shù)評價制度日趨混亂。即使有少數(shù)學(xué)者對學(xué)術(shù)評價機制提出一些批評，也大多不得要領(lǐng)。

這里，我可以拿人們知其然而不知其所以然的影響因子為例進行說明。

眾所周知，影響因子（Impact Factor，IF），即某期刊前兩年發(fā)表的論文被引用總次數(shù)，除以該期刊在前兩年發(fā)表的論文總數(shù)。后來又有復(fù)合影響因子，這個概念是指，以期刊綜合統(tǒng)計源文獻、博碩士學(xué)位論文統(tǒng)計源文獻、會議論文統(tǒng)計源文獻為復(fù)合統(tǒng)計源文獻計算，被評價期刊前兩年發(fā)表的可被引文獻在統(tǒng)計年的被引用總次數(shù)與該期刊在前兩年內(nèi)發(fā)表的可被引文獻總量之比。

盡管影響因子這個概念的發(fā)明也就40年的時間（1975年開始使用），但它的影響卻非常驚人?？梢院敛豢鋸埖卣f，這個概念現(xiàn)已成為國際上通用的期刊評價指標，它不僅僅是一種測度期刊有用性和顯示度的指標，而且甚至成為測度期刊的學(xué)術(shù)水平乃至論文學(xué)術(shù)質(zhì)量的重要指標。所以，中國學(xué)術(shù)期刊光盤版電子雜志社索性以此為題，每年都出版《中國學(xué)術(shù)期刊影響因子年報》，且成為業(yè)界的一件大事。根據(jù)通常的理解，影響因子的主要影響在兩個方面：它不僅是評價學(xué)術(shù)期刊的一個主要指標，而且也是評價論文的一個重要指標。也就是說，影響因子在學(xué)術(shù)評價方面幾乎可以通吃了！

文獻研究者最喜歡，也最重視影響因子數(shù)據(jù)，各評價機構(gòu)幾乎均將影響因子定為最重要的評價指標，有的評價機構(gòu)甚至作為唯一的指標；科研管理者乃至學(xué)者不明就里，也往往喜歡以此作為學(xué)術(shù)評價的重要標準。如果方法正確，將影響因子作為學(xué)術(shù)評價的標準之一，其實完全是可以的；但如果方法不對，也就是說，如果在使用影響因子進行學(xué)術(shù)評價時不分學(xué)科，將影響因子作為普世的學(xué)術(shù)評價工具，那就大錯特錯了，因為不同學(xué)科之間論文的影響因子數(shù)據(jù)相差實在太大。對于專業(yè)期刊來說，不同學(xué)科專業(yè)期刊的影響因子差別巨大；對于綜合性期刊來說，偏重人文與偏重社科的期刊之影響因子的差別也非常之大。

相關(guān)研究專家對人文社會科學(xué)各學(xué)科的引文特征實證分析后，發(fā)現(xiàn)人文學(xué)科與社會科學(xué)學(xué)科之間存在巨大差異，即使同樣在人文學(xué)科，引文特征也存在極大差異。有學(xué)者采用自行研制的人文社會科學(xué)引文數(shù)據(jù)庫的數(shù)據(jù)，分別統(tǒng)計了各學(xué)科的平均引文半衰期，測試出了各學(xué)科領(lǐng)域的最佳評價時段，其研究結(jié)果頗引人注意，見表1。從表1可見，以歷史、文學(xué)為代表的人文學(xué)科的引文半衰期在10年以上，而社會科學(xué)學(xué)科的引文半衰期都在2.8—3.8年之間，幾乎相差3倍；當然，比較意外的是哲學(xué)學(xué)科，半衰期是4.2年，與我們的常識稍有差距。

表1 各學(xué)科引文的平均半衰期

資料來源：任全娥：《基于文獻引證關(guān)系的人文社會科學(xué)論文評價》，《大學(xué)圖書館學(xué)報》，2012年第3期。

目前，已有很多學(xué)者對引文分析的局限性進行了研究，他們主要歸納為以下三條：第一，引文原因或動機的復(fù)雜性影響引文分析的客觀性。大量事實表明，作者引用文獻的目的不都是因為需要利用某些觀點或資料，也可能出于其他非正常的動機；而這種出于非正常動機的引用，在引用文獻與被引用文獻之間就形成了“假聯(lián)系”或“假相關(guān)”。比如以下方式：阿諛某人，自我吹噓，相互吹捧，為支持自己的觀點而片面引用，為維護某一學(xué)派或師承關(guān)系而非正常引用，迫于某種壓力的引用，等等。第二，技術(shù)上的缺陷影響引文分析的正確度。首先，文獻收集的不完全性會直接影響引文分析的結(jié)果，而事實上任何學(xué)科的文獻分析都無法收集完全。其次，暗引現(xiàn)象同樣會影響引文分析的正確性。所謂暗引，即文章引用其他論著的內(nèi)容，卻不注明出處。這種違反學(xué)術(shù)規(guī)范的現(xiàn)象在各學(xué)科的研究中比比皆是。第三，引證分析對研究有時會產(chǎn)生誤導(dǎo)作用。由于國家、民族以及文化的差異，某些知識領(lǐng)域或內(nèi)容可能并非人類所共享；如果過多強調(diào)或追求共同性，必然會脫離自己國家的具體實踐。瑞典學(xué)者A.Elzinga指出，面向由核心期刊引用率決定的國際研究工作的前沿，“往往意味著面向像美國那樣的核心國家”，“意味著像美國、英國和法國這樣一些國家將逐漸占據(jù)支配地位。然而對較小的國家來說，適應(yīng)最大共性可能意味著擴大研究與實踐之間的鴻溝”。實際情形是，過多強調(diào)征引指標和共享，往往是后發(fā)國家的普遍現(xiàn)象。這種做法最惡劣的后果，是粗魯?shù)囟髿⒆约罕久褡宓奈幕瘋鹘y(tǒng)；越是歷史悠久的國家，對本民族歷史文化的傷害就越嚴重。

上文所說引文評價的三個局限性中，最后一條尤為關(guān)鍵。也就是說，從自然科學(xué)引發(fā)的學(xué)術(shù)評價工具，在運用到人文社會科學(xué)的時候，會發(fā)生嚴重的變異，具體運用時需要格外小心，否則，評價有失公允，就會損害正常的學(xué)術(shù)研究。

目前學(xué)術(shù)評價機制不僅使人文學(xué)科處于極其不利的處境，主要刊登人文學(xué)科學(xué)術(shù)論文的社科學(xué)術(shù)期刊也同樣陷入困境。這里，我仍然主要以影響因子為例加以說明。

上文已經(jīng)指出，不同學(xué)科論文之間的影響因子差距極大，這就造成刊發(fā)不同學(xué)科論文學(xué)術(shù)期刊影響因子的差別極大，人文學(xué)科與社會科學(xué)學(xué)科期刊的影響因子差別更大。比如《經(jīng)濟研究》與《歷史研究》同是中國社會科學(xué)院的著名期刊，但根據(jù)中國知網(wǎng)2014年發(fā)布的影響因子年報統(tǒng)計，兩本最著名的專業(yè)期刊，影響因子差別極大，《經(jīng)濟研究》復(fù)合影響因子達9.831，而《歷史研究》的復(fù)合影響因子只有0.954，相差整整10倍。所謂經(jīng)濟學(xué)“帝國主義”，文史哲“第三世界”，在學(xué)術(shù)評價領(lǐng)域顯露無遺。詳見表2。

表2 專業(yè)期刊影響因子比較

資料來源：CNKI 2014年公開數(shù)據(jù)，http：//www.cnki.net/

在綜合性期刊中，除《中國社會科學(xué)》為5.596外，絕大多數(shù)綜合性期刊如果能超過1，已經(jīng)是很高的數(shù)字了。就學(xué)報而言，《浙江大學(xué)學(xué)報》和《中國人民大學(xué)學(xué)報》最高，《復(fù)旦學(xué)報》為1.094，《文史哲》則只有0.646。可是我們并不能以此判斷后兩家學(xué)報比前兩家學(xué)術(shù)水平低，為什么？道理很簡單，是學(xué)科文章分布造成的。前兩個學(xué)報側(cè)重社會科學(xué)學(xué)科的文章，尤其是經(jīng)濟學(xué)、社會學(xué)等學(xué)科文章；而后兩個學(xué)報側(cè)重人文學(xué)科，尤其是文史學(xué)科的文章。這種學(xué)科分布造成了影響因子的巨大差異。見表3。

表3 綜合性期刊影響因子比較

資料來源：CNKI 2014年公開數(shù)據(jù)，http：//www.cnki.net/

因此，僅僅或主要依靠影響因子數(shù)據(jù)評價期刊，不僅是極不科學(xué)的，而且會對人文社科期刊造成嚴重的負面影響。這種評價標準沒有考慮到學(xué)科之間的差異。人文學(xué)科有自己特殊的研究規(guī)范，以歷史學(xué)科為例，實證性歷史學(xué)文章多是徑直爬梳史料，在經(jīng)過考證辨析后得出結(jié)論，此類文章較少引證現(xiàn)當代人的論著。這是歷史學(xué)研究的重要特點之一，當然，這既是歷史學(xué)研究的優(yōu)長之處，也是歷史學(xué)研究的短板之處。說它有優(yōu)長之處，是因為歷史學(xué)者習(xí)慣直接從原始材料入手，尤其注重第一手的材料，這是歷史學(xué)科不同于任何其他學(xué)科的重要特點?？墒?，這種研究方法同樣有不足之處，這說明歷史研究學(xué)者比較容易忽視同行的相關(guān)研究，不僅對同行的尊重不夠，而且容易形成重復(fù)性研究。我主張，歷史學(xué)者在注重原始材料的同時，應(yīng)該盡量汲取其他學(xué)科尤其是社會科學(xué)學(xué)科的做法，即不僅應(yīng)該很好總結(jié)前人的研究成果，而且還應(yīng)盡可能多的引用別人已有的研究成果，避免重復(fù)性勞動。當然，歷史學(xué)的學(xué)科特性以及研究方法，使該學(xué)科論文在被引方面永遠不可能同經(jīng)濟學(xué)相提并論。

鑒于此，不同學(xué)科論著的學(xué)術(shù)水平，不宜都拿影響因子作為評價標準，更不宜將不同學(xué)科的論文進行影響因子的比較。如果要進行比較，只能在同一學(xué)科內(nèi)，甚至要在二級三級學(xué)科層次上進行比較。學(xué)術(shù)期刊同樣如此，不同學(xué)科的專業(yè)學(xué)術(shù)期刊不能用影響因子進行比較；綜合性期刊的發(fā)文差異很大，也很難用影響因子來比較。上面所舉例證，足以說明問題。

袁培國先生對濫用影響因子提出批評，他說：“把針對以英文為主、期刊類別與其刊載論文類別相對一致的科技期刊的期刊影響因子原封不動地運用于大多是一種期刊刊載多學(xué)科論文的中文人文社會科學(xué)期刊，在現(xiàn)實中便帶來了新的問題，而科研管理使用的簡單化、絕對化和誤用更加劇這些問題的復(fù)雜性和嚴重性?！保?span >《中文文科期刊影響因子評價作用之反思》，南京：《南京大學(xué)學(xué)報》，2011年第3期）可見，學(xué)術(shù)評價機制不合理有很多復(fù)雜的因素，需要我們做更深一步的研究。

在人文社會科學(xué)學(xué)術(shù)評價，尤其是職稱評定中，代表作制度是一個相對不錯的制度設(shè)計，得到學(xué)者較為普遍的認同，因為代表作制度激勵學(xué)者做高水準的研究成果，而不鼓勵急功近利、單純追求成果的絕對數(shù)量。多年來中國社會科學(xué)院執(zhí)行這項學(xué)術(shù)評價制度比較好，為廣大學(xué)術(shù)界所認可；但可惜的是，自該院設(shè)立了創(chuàng)新工程后，便逐漸放棄這套學(xué)術(shù)評價體系。如今該院的某些功利性做法，甚至超過國內(nèi)某些高校，比如現(xiàn)在學(xué)術(shù)成果評定要看刊物級別，要拼數(shù)量，相關(guān)的評價機構(gòu)也要對國內(nèi)學(xué)術(shù)期刊進行分級。前后比較，社科院的這種做法是一種倒退，令人惋惜。

學(xué)術(shù)評價出現(xiàn)上述重數(shù)量輕質(zhì)量的現(xiàn)象，有很多原因，其中有兩個原因特別重要：一是同行專家或?qū)W術(shù)共同體作用發(fā)揮不充分，此點下文將有闡發(fā)；二是評價機構(gòu)的作用日益膨脹，正是因為在評價機構(gòu)的推波助瀾之下，導(dǎo)致學(xué)術(shù)評價的異化現(xiàn)象越來越嚴重。更為明確地說，學(xué)術(shù)評價機構(gòu)是形式評價尤其是量化評價的推手，量化評價體系是一種貌似科學(xué)而實則粗暴的人文社會科學(xué)評價機制，對人文社會科學(xué)的發(fā)展會造成深重的傷害。