學術論文評價時,主要依據定性和定量2種方式進行定性評價,主要憑經驗、水準來做直覺上的把握,即通過人腦思維進行綜合判斷,對學術成果做出定位。定性的過程,實際上是意識與意識的交流過程思想與思想的對話過程,也是主體對物件的認識、讀解、品味、審核的過程。其間,主觀意念起著重要作用因為個體判斷受特定文化環境及觀念的制約。

一般情況下,對學術成果的定性評價中,需要審視其創新性程度(時新性,開創性,前瞻性),理論性程度(理論的涵蓋性,普遍性完備性)或實用性程度(效益,應用功能,可行性),依據性程度(觀察、實驗結果的支援,可靠的材料來源),詮釋性程度(簡明性,精確性,邏輯性,內在的自治性,外在的與其它學科的相容性)。也就說,涉及內容的新穎性,基本依據或前提的可靠性;概念使用的科學性;論據的可靠性和充分性;研究方法的可靠性和有效性,論證邏輯的嚴密性和完每性。這些問題,可以歸納為四度:一是新度二是信度,三是效度,四是精度。當然,定性評價的公正,只能是一種可能,而不是必然。

定量評價,主要借助學術成果在客觀上達到的某種數量指標進行量化的衡度和測評。量化測度,大多利用文獻計量學理論、資料和比值來分析統計。諸如影響論和效益論,主要通過數值計算得到顯示,包括影響程度,發行流通率,資料庫和文摘刊物的收錄率,轉載率,引證量①,得到有關機構、組織的獎勵等級與次數,資訊密度等等,都是量化測試的途徑和方式。實際上,被有關決策部門參考採納的情況,在生產或工作中的應用情況,對學術文化資訊的增殖情況,帶來的經濟效益情況等等,都可以通過相應的數值得到顯示。

定量評價的客觀因素大,可以排除主觀局限性,而且標識的界限也相對清晰,但其對內涵描述的適應性又非常有限,因為指標往往不等於目標,量化指標中的機械性、單維性、形式性不可避免人文價值、社會效益、精神內涵具有的內隱、潛在意義和特徵,是數位化的「剛性指標」難以描述的。放之四海而皆準的評價方法不在。過分的量化、細化反而失去公正。數學「互克原理」揭示的個思想是:在特定的意義上,模糊反而準確,精確化反而失去精確。

在有些評價機構學術成果評獎的規定中,為制定確切的量化標準把參考文獻的多少也作為一個評價的指標。有些科研指導書中道:「參考文獻的品質和數量,是評價論文品質和水準的依據」。種觀點和意見,無疑起著一種誤導作用。參考文獻的數量和論水準不成正比例關係,數量大,會造成尾大不掉,畫蛇添足。發發現性的成果,有時反倒沒有參考什麼文獻。而不少旁徵博引論文,反倒沒有自己的思想。

「刊用論」評價標準,可以看作是量化的一種形式。它把學刊物劃分為不同的等級。以發表的刊物的等級定位論文的檔次這種做法,在定職、評獎工作中使用比較廣泛,但它的弊病是顯而易見的。所謂「刊用論」,論「刊」不論「文」。按刊物級別,可以分為3等:國家級,省部級,地方級。就一般情況來看,級別高的刊物發表的論文品質比級別低的品質普遍要高。但也不是絕對的。刊可以作為一個參考,但把它絕對化,必然會造成評價的失誤。在學史上,許多重大的發明和發現,剛開始時,反而只能發表在不起眼的小刊物上。學術成果的評價,重要的是看內容,不是看「出身」,看「牌子」。

評價不僅需要正確的方式方法,而且需要建立體現學術內在發展規律的評價體制。如專家評審制,回避制,民主表決制,公示制,回饋制等。建立多元的、多層次的動態評價系統,摒棄單一的表態式的評價標準,允許有時間、環境、理論等方面的多變數的函數張力,允許有間隔階段檢驗及歷史的相對性,兼顧事實尺度與功能尺度,定性與定量相結合,證實與證偽相結合,眼前與長遠相結合等等,才有利於學術的繁榮與發展。