STATA经济指数构建系列(1)泰尔指数
发布网友
发布时间:2024-09-27 18:33
我来回答
共1个回答
热心网友
时间:2024-11-18 05:42
在学习STATA的过程中,多次有同学咨询如何构建经济差异指数,为此,我将之前做过的程序进行了整理,并计划推出STATA经济指数构建系列,包括泰尔指数、基尼指数、库兹涅茨比率等内容,本期将从泰尔指数开始。
泰尔熵标准(Theil's entropy measure)或称泰尔指数(Theil index)是衡量个人之间或地区间收入差距(或不平等度)的指标。Theil指数用于表示区域经济差异状况,数值越大,差异程度越大。
本系列所有数据均来自统计局、交易所等官方网站,具体数据已开源,详见Chongminglun/经济指数构建数据源。本文示例数据为江苏省1990-2017年各城市总人口及GDP数据,包括13个城市,并分为苏中、苏南、苏北三个区域,计划使用泰尔指数测算区域经济差异的演变趋势。
Theil指数最早由Theil与Henri提出。其最大特点是可以进行分解,将区域之间总差异分解成两部分。Theil指数包括两种Theil指标,即Theil指数T和Theil指数L。两者的差距在于T指数以收入数据计算加权权重,而L指标以人口计算加权权重。
本文采用Theil指数T,示例数据中收入数据为GDP,以GDP比重加权计算。对Theil指数进行一阶分解过程,可以把江苏省总差异水平分解为苏南、苏中、苏北三大区域间差异与区域内差异,总差异的Theil指数公式如下:[公式]。
接下来使用STATA来计算泰尔指数:
1、数据导入:由于数据中第一行是中文列名,第二行是英文,所以需要设置下单元格区域(cellrange)从第二行开始,并选择将区域内的首行设为标题(firstrow)。
2、区域及整体数据汇总:汇总统计区域总GDP、全省总GDP,区域总人口和全省总人口,因为示例里没有总数据,所以这里要做一步汇总。如果大家自己计算时有现成的总数据,则此步可以跳过。
3、各区域城市间差异计算:根据前面指数分解中第i区域的城市间差异计算公式,设置计算代码。
4、计算总体指数的区域内差异(TWR)和区域间差异(TBR)并加总泰尔指数。
5、格式整理及数据导出:去掉底层计算数据,并对区域数据做长表转宽表。注意下导出来的excel数据打开看虽然是0,但只是数字位数显示问题,调整小数位数后可显示正常。
最后在excel里做两个图展现一下江苏省泰尔指数变化趋势。从图上看,江苏省各区域间差异明显大于区域内城市间差异,果然是散装江苏啊。。。
本期泰尔指数构建就到这里。有人问Theil指数L怎么计算,其实很简单,计算城市差异和后面区域内区域间差异的代码中,原本Y的地方换成P,P的地方换成Y就行了,比如:
下一期介绍基尼指数的stata构建。