从计量水平看综合评价中总量指标的局限性
评价指标的选择是综合评价的灵魂,是评价结果能否得到各方认可的关键。研究者在选择评价指标时应力求做到“有什么”“如何用”“为什么”,即充分了解评价指标在现实中存在与否,能不能通过可靠渠道得到数据;如何对搜集到的数据进行必要的整理,以及它与评价目标有何种必然联系,是否与评价体系存在逻辑契合,这就需要对所选指标的特性有充分的了解。
多数统计教科书将统计指标按其功能划分为总量指标、相对指标和平均指标三类,之下又按更为具体的功能划分为不同类型的总量指标、相对指标和平均指标。其实,各类统计指标用于综合评价都是有条件的,用于综合评价的指标也不限于统计指标,运用定性指标经量化后反映一些较为复杂的事物,如管理质量、政府作为、领导者能力等,也常见于综合评价。
从统计方法论角度看,不同类型的统计指标反映客观现象特征的“能力”是不同的,也就是统计指标的计量水平是不同的。评价应尽可能应用计量水平较高的指标。
统计学将计量水平由低到高、由粗略到精确分为四个层次,即定类水平、定序水平、定距水平和定比水平。
定类水平又称为列名水平。是最粗略、计量层次最低的计量水平。它是按照研究对象的某种属性对其进行平行的分类,并用数字来表示,该数字仅作为各类的代码,度量各类之间的类差别,不反映各类的优劣、量的大小或顺序。如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类水平的主要数学特征是“=”或“≠”。在统计处理中虽然可以计算单位数,但它不能表明第一类的一个单位可以相当于第二类的几个单位。定类水平在评价中很少用到。
定序水平又称为顺序水平。是对客观现象各类之间的等级差或顺序差的一种测度,是比定类水平高一级的计量水平。定序水平不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。例如,学生成绩可以分为优、良、中、及格和不及格五类,也可以以打分的形式分为5分、4分、3分、2分几类,或以百分制打出由高到低的分数。定序水平虽然无法表明一个优等于几个良,或一个5分等于几个4分,但能够确切表明优高于良,5分优于4分。定序水平的主要数学特征是“>”或“<”。在统计数列中可以确定定序水平的确切位置。在统计评价中,对于一些定性问题经常要采取由专家打分的方法进行评价。
定距水平又称为间隔水平。是对现象类别或次序之间间距的测度,是比定序水平更高一级的水平。定距水平不但可以用数字表示事物各类别的不同和顺序大小的差异,而且可以用确切的数值反映事物之间在“量”的方面的差异。定距水平使用的计量单位一般为实物单位或价值单位。反映事物规模的数据都属于定距水平,例如产品产量、人口数、企业数、GDP、R&D经费内部支出、R&D人员数或研究人员数等。定距水平的主要数学特征是“+”或“-”。定距水平在统计数据中占据重要地位。
定比水平又称为比率水平。它是在定距水平的基础上确定相应的比较基数,将两种相关的数值加以对比而形成相对数(或平均数)。用于反映现象的结构、比重、速度、密度等数量关系。例如,将一国的国内生产总值(GDP)与该国的人口数对比,计算人均GDP,以此反映该国的经济能力。定比水平的主要数学特征是“×”或“÷”。在统计评价中,广泛地运用定比水平的指标进行评价。
在统计活动中,通过调查得到调查单位的数据经汇总后就成为总量指标,因而它是最基本的统计指标,是认识客观现象数量特征的起点,也是计算其他统计指标的基础。但从计量水平的角度看,总量指标属于定距水平,用于综合评价是有一定局限性的,不如定比水平的指标。
在综合评价中评价指标体系的容量是有约束的,因而选择定比水平的指标要比选择总量指标来的更“划算”。如选择R&D经费内部支出就不如选择R&D经费投入强度包含的信息量更大,后者既包含了R&D经费内部支出规模的信息,还包含了GDP规模的信息,以及R&D经费内部支出与GDP相互协调关系的信息,因此R&D经费投入强度才成为国际社会衡量国家或地区科技创新水平的“金标准”。
在统计学教科书中,将总量指标称为“数量指标”,而把平均指标和相对指标称为“质量指标”,是指总量指标只能反映研究对象的外延规模,且与客观对象外在客观条件密切联系的,如GDP指标总是和土地面积、人口规模、自然条件相关联,难以反映总体更深层次的特征,在许多以“质量”为主题的研究中不当使用总量指标往往会扭曲评价结果,当前并不鲜见。
总量指标在综合评价中难以确定参评对象一致的评价标准,对于一些总量指标,河南、山东、四川等人口大省的规模远高于京、津、沪,如果用前者的标准衡量后者,不论后者如何努力也不可能达到前者的规模,除非是客观条件十分接近的评价对象。再有,使用总量指标只能应用于采用非固定标准进行评价的研究,只能进行参评对象位次的动态比较而不能进行评价值的动态比较。