立言评价_北京立言创新科技咨询中心

立言动态

从计量水平看综合评价中总量指标的局限性

评价指标的选择是综合评价的灵魂，是评价结果能否得到各方认可的关键。研究者在选择评价指标时应力求做到“有什么”“如何用”“为什么”，即充分了解评价指标在现实中存在与否，能不能通过可靠渠道得到数据；如何对搜集到的数据进行必要的整理，以及它与评价目标有何种必然联系，是否与评价体系存在逻辑契合，这就需要对所选指标的特性有充分的了解。

多数统计教科书将统计指标按其功能划分为总量指标、相对指标和平均指标三类，之下又按更为具体的功能划分为不同类型的总量指标、相对指标和平均指标。其实，各类统计指标用于综合评价都是有条件的，用于综合评价的指标也不限于统计指标，运用定性指标经量化后反映一些较为复杂的事物，如管理质量、政府作为、领导者能力等，也常见于综合评价。

从统计方法论角度看，不同类型的统计指标反映客观现象特征的“能力”是不同的，也就是统计指标的计量水平是不同的。评价应尽可能应用计量水平较高的指标。

统计学将计量水平由低到高、由粗略到精确分为四个层次，即定类水平、定序水平、定距水平和定比水平。

定类水平又称为列名水平。是最粗略、计量层次最低的计量水平。它是按照研究对象的某种属性对其进行平行的分类，并用数字来表示，该数字仅作为各类的代码，度量各类之间的类差别，不反映各类的优劣、量的大小或顺序。如，人口按性别分为男女，用“1”表示男性，用“0”表示女性。定类水平的主要数学特征是“=”或“≠”。在统计处理中虽然可以计算单位数，但它不能表明第一类的一个单位可以相当于第二类的几个单位。定类水平在评价中很少用到。

定序水平又称为顺序水平。是对客观现象各类之间的等级差或顺序差的一种测度，是比定类水平高一级的计量水平。定序水平不仅可以将研究对象分成不同的类别，而且还可以反映各类的优劣、量的大小或顺序。例如，学生成绩可以分为优、良、中、及格和不及格五类，也可以以打分的形式分为5分、4分、3分、2分几类，或以百分制打出由高到低的分数。定序水平虽然无法表明一个优等于几个良，或一个5分等于几个4分，但能够确切表明优高于良，5分优于4分。定序水平的主要数学特征是“＞”或“＜”。在统计数列中可以确定定序水平的确切位置。在统计评价中，对于一些定性问题经常要采取由专家打分的方法进行评价。

定距水平又称为间隔水平。是对现象类别或次序之间间距的测度，是比定序水平更高一级的水平。定距水平不但可以用数字表示事物各类别的不同和顺序大小的差异，而且可以用确切的数值反映事物之间在“量”的方面的差异。定距水平使用的计量单位一般为实物单位或价值单位。反映事物规模的数据都属于定距水平，例如产品产量、人口数、企业数、GDP、R&D经费内部支出、R&D人员数或研究人员数等。定距水平的主要数学特征是“＋”或“－”。定距水平在统计数据中占据重要地位。

定比水平又称为比率水平。它是在定距水平的基础上确定相应的比较基数，将两种相关的数值加以对比而形成相对数（或平均数）。用于反映现象的结构、比重、速度、密度等数量关系。例如，将一国的国内生产总值（GDP）与该国的人口数对比，计算人均GDP，以此反映该国的经济能力。定比水平的主要数学特征是“×”或“÷”。在统计评价中，广泛地运用定比水平的指标进行评价。

在统计活动中，通过调查得到调查单位的数据经汇总后就成为总量指标，因而它是最基本的统计指标，是认识客观现象数量特征的起点，也是计算其他统计指标的基础。但从计量水平的角度看，总量指标属于定距水平，用于综合评价是有一定局限性的，不如定比水平的指标。

在综合评价中评价指标体系的容量是有约束的，因而选择定比水平的指标要比选择总量指标来的更“划算”。如选择 R&D经费内部支出就不如选择R&D经费投入强度包含的信息量更大，后者既包含了R&D经费内部支出规模的信息，还包含了GDP规模的信息，以及R&D经费内部支出与GDP相互协调关系的信息，因此R&D经费投入强度才成为国际社会衡量国家或地区科技创新水平的“金标准”。

在统计学教科书中，将总量指标称为“数量指标”，而把平均指标和相对指标称为“质量指标”，是指总量指标只能反映研究对象的外延规模，且与客观对象外在客观条件密切联系的，如GDP指标总是和土地面积、人口规模、自然条件相关联，难以反映总体更深层次的特征，在许多以“质量”为主题的研究中不当使用总量指标往往会扭曲评价结果，当前并不鲜见。

总量指标在综合评价中难以确定参评对象一致的评价标准，对于一些总量指标，河南、山东、四川等人口大省的规模远高于京、津、沪，如果用前者的标准衡量后者，不论后者如何努力也不可能达到前者的规模，除非是客观条件十分接近的评价对象。再有，使用总量指标只能应用于采用非固定标准进行评价的研究，只能进行参评对象位次的动态比较而不能进行评价值的动态比较。