求泰尔指数如何计算怎么算啊公式如下

点击联系发帖人 时间：2016-12-18 01:41

泰尔指数计算

苹果/安卓/wp
积分 4, 距离下一级还需 6 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯下一级可获得
道具: 金钱卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
本帖最后由 wanghaidong918 于
04:32 编辑
我正在做关于新疆三大区域，北疆（包括乌市、克拉玛依市、石河子市、昌吉州、伊犁州直、塔城地区、阿勒泰地区、博州）、东疆（吐鲁番地区、哈密地区）和南疆（巴州、克州、阿克苏地区、和田地区）的区域经济差距分析，现在需要进行泰尔指数计算，来衡量三大区域间差距和各自区域内差距对全疆区域经济总差距的贡献，数据比如某一年，三大区域各自地州的GDP值、新疆GDP总值、地州的人口数，新疆总人口数都已找全，问题是，泰尔公式要怎样代值，泰尔指数通过EXCEL计算的步骤是怎样的？
载入中......
可以计算。直接用EXCEL就能计算，Theil index: GE(1)=w1*log(w1/e1)+w2*log(w2/e2)+…+wg*log(wg/eg)，其中wg表示第g组收入占总收入的比重，eg表示g组人口数占总人口数的比重
本帖被以下文库推荐
& |主题: 12506, 订阅: 29
四川省区域经济差异的定量化研究
刘　洋　鞠　薇　翟有龙
一、区域差异研究的一般方法　　　　
在研究区域差异问题中，绝对差距和相对差距的分析方法是主要的分析方法。绝对差距方法包括平均差、标准差、离差和极差等方法，但是这些方法不能全面地反映区域差距的结构性特征。相对差距分析方法主要包括变异系数、基尼系数和泰尔指数三种指标，它们能较细致地反映区域差距的结构性特征。下面对相对差距分析方法的三种指标进行简要介绍。[1] 　　　　(一)变异系数法　　使用各地区加权人均值差异系数来消除不同人口规模对人均GDP相对差异系数的影响,并结合运用相对差异系数与σ系数共同反映不同指标地区相对差距变化。还可以分解为某一部门的加权变异系数和任意两部门之间的加权协方差变异系数。　　　　(二)泰尔指数　　也是表示收入差距程度的常用指标,Theil T和Theil L是两个有代表性的指标。其用于区域差距研究最大的优点就在于它具有在不同样本组(或地区)之间进行分解的性质,可以分解为子样本内部和子样本之间的差距,并且差距的变动也进一步分解为组间差距的变动和组内差距的变动,因而在区域差距研究文献中应用广泛。　　　　(三)基尼系数　　常用于衡量地区差距，是测度收入差别最常用的指标,有着多方面的优点:一是可以用一个数值来反映收入差别的总体状况；二是可以从收入构成的角度很方便地进行分解分析；三是能够结合人口分布因素来计算地区不平等的程度；四是进行基尼系数的产业分解比加权变异系数方法更方便。　　　　二、四川省区域经济差距测量　　　　首先计算四川省各地区间总的人均GDP的变异系数，计算公式如下：　　　　　　pi为i地区的人口数，Xi为i地区的人均GDP,N为全省地区数，p为全省人口总数，X[TX-]为全省人均GDP。2003年四川省各地区间加权人均GDP的变异系数计算结果为：V=0.72。与我国从年的平均变异系数0.722相当。　　再分别计算各个地区的人均收入的相对偏离贡献率，其计算公式为：　　　　计算结果如表1所示：　　表12003年四川省城乡收入差距指标地区总人口非农业　　　　资料来源：《四川省2003年统计年鉴》，部分数据由统计年鉴中数据计算得来。　　从表中的计算结果可以看出：成都的人均GDP最高，达到了17915元，是巴中市人均GDP 3040元的近六倍。成都、攀枝花、德阳、绵阳四个城市的人均GDP远远高于其他城市和地区，属于工业基础较发达的地区，除巴中、广元、南充外，其他城市和少数民族自治区的人均GDP水平较为接近。农村居民人均纯收入除了阿坝藏族自治州、甘孜藏族自治州、凉山彝族自治州三个少数民族自治地区外，收入较集中分布在2000元—3000元之间，最高的是成都3655.7元。这说明四川省内农村居民收入总体水平较低，地区之间差距较小。城乡居民收入差距较高的是三个少数民族地区，城乡收入比最高达到了6.26∶1，最低达到2.55∶1也高于其他城市，这主要是因为三个自治州的人口较少，工业基础薄弱，城乡差距明显。其他地区的城乡收入差距比主要集中分布2—3∶1左右。成都的城乡收入差距之比达到2.41∶1，其他城市地区城乡收入差距最高的是巴中，达到3.43∶1,最低的是遂宁2.01∶1。我国从1994年开始，城乡之间收入差距出现了下降的趋势，但是从1997年起又逐步扩大。2001年居民的人均收入几乎是农村居民的3倍。如果把非货币因素考虑进去，我国的城乡收入差距将会达到3.5∶1。与近期我国城乡收入差距扩大的趋势相比，四川省平均城乡收入差距比例达到3.15∶1，与2001年我国城乡收入差距的比例相似。　　从地区人均收入偏离全省平均水平份额来比较分析，成都市的人均收入水平远远高于四川省内其他地区，它和攀枝花、德阳、绵阳属于发达地区，除攀枝花外，德阳、绵阳位于成都市周边南北纵向延伸线上，受成都经济辐射带动作用较强，城市化水平与经济发展水平高。攀枝花主要是矿产与能源工业基地，城市与经济发展速度较快。而雅安、自贡、乐山、宜宾分布在川南与川东北地区，农业生产条件较好，工业有一定的基础，但长期发展较缓慢，经济积累不足，城市化水平低。泸州、遂宁、内江、眉山主要由于矿产资源贫乏，工业基础较弱，工业化水平落后。最后广元、南充、广安、巴中、甘孜、凉山等属于落后地区，这些地区是全国、全省重点贫困地区，交通不发达，经济以农牧业为主，工业化水平和城市化水平低。　　从相对偏离贡献率来分析比较，贡献率越大，城乡经济发展水平差距越明显，与平均水平差距越大；相反，贡献率越小，城乡经济发展水平越低，城乡差距不明显。比较贡献率可以看出，成都的贡献率最高，城乡经济发展差距很明显，收入差距大，攀枝花市排在第二位，而其他地区城乡经济发展水平差距不明显，其中自贡市的城乡差距贡献率几乎为0。总的来说，四川省城乡收入差距不很悬殊，除少数城市外，人均收入的总体水平比全国低，城市化水平较低。　　以地市州为基本的地理单元，四川省经济发展水平的区域差异主要表现为中高周低，以成都平原为中心，与绵阳、德阳、雅安地区、乐山南北连成一片，交通发达、工业基础较好，组成成都大平原经济发展区，发展水平最高，成为四川省经济发展的增长极核，由此向四周经济发展水平逐次下降。四川省经济发展水平高低的空间变化大体与四川省地形从平原到丘陵、到山地和高原的海拔高度变化成负相关关系。而攀枝花作为全国著名的能源与矿产基地，虽然经济发展水平较高，但其经济的辐射作用小于成都的作用。　　　　三、四川省区域经济差异的空间结构　　　　为了进一步认识四川省区域差距的结构，采用泰尔指数的分解方法将四川省2003年收入差距分解成地区内的收入差距和地区之间的收入差距。以总体差距为100%计算，分别观察各个差距形成中所占的贡献份额。泰尔指数的分解如下：[2] 　　　　最后计算泰尔指数：I=|IW IB|=|-0.148 0.058|=0.09,计算结果可得：四川省区域经济差异的地区间贡献份额为-14.8%，地区内的贡献份额为5.8%，泰尔指数的绝对值达到0.09。地区间差距的贡献份额超过了地区内的贡献份额的两倍多，这证明了四川省地区经济差距的主要是由于地区间差距较明显。与我国1978年—2002年的泰尔指标相比较，低于全国平均泰尔指数0.112，[3]但是四川省地区间的贡献份额的绝对值14.8%高于全国地区间的平均水平14.63%，地区内的贡献份额5.8%低于全国的平均水平6.6%。　　四、基尼系数分解方法　　为了进一步了解四川区域之间产业的差距，本文采用基尼系数产业分解法，其公式为：[4]：　　　　其中，G为总的基尼系数，Ck为分项集中率（也即分项基尼系数），μK,μ分别代表平均分项和人均总收入。SkCk/G×100%表示第K项产业收入对基尼系数的百分点贡献。本文按三次产业分类，定义[SX(]CK[]G[SX)]为相对集中系数，如该系数大于1，表示对基尼系数起促进作用。以上文表1为基本数据计算，结果如下：　　CK=0.26，总的基尼系数G=0.257.分别计算出的三次产业的相对集中系数为：0.805（第一产业）；1.616（第二产业）；1.470（第三产业）。由上述可知第二和第三产业系数大于1，对基尼系数起促进作用。最后依次求出第K项产业对基尼系数的贡献份额为：第一产业对基尼系数的贡献份额是20.7%；第二产业对基尼系数的贡献份额是41.5%；第三产业对基尼系数的贡献份额是37.8%。　　本文为全文原貌　未安装PDF浏览器下载安装　原版全文　　一、区域差异研究的一般方法　　　　在研究区域差异问题中，绝对差距和相对差距的分析方法是主要的分析方法。绝对差距方法包括平均差、标准差、离差和极差等方法，但是这些方法不能全面地反映区域差距的结构性特征。相对差距分析方法主要包括变异系数、基尼系数和泰尔指数三种指标，它们能较细致地反映区域差距的结构性特征。下面对相对差距分析方法的三种指标进行简要介绍。[1] 　　　　(一)变异系数法　　使用各地区加权人均值差异系数来消除不同人口规模对人均GDP相对差异系数的影响,并结合运用相对差异系数与σ系数共同反映不同指标地区相对差距变化。还可以分解为某一部门的加权变异系数和任意两部门之间的加权协方差变异系数。　　　　(二)泰尔指数　　也是表示收入差距程度的常用指标,Theil T和Theil L是两个有代表性的指标。其用于区域差距研究最大的优点就在于它具有在不同样本组(或地区)之间进行分解的性质,可以分解为子样本内部和子样本之间的差距,并且差距的变动也进一步分解为组间差距的变动和组内差距的变动,因而在区域差距研究文献中应用广泛。　　　　(三)基尼系数　　常用于衡量地区差距，是测度收入差别最常用的指标,有着多方面的优点:一是可以用一个数值来反映收入差别的总体状况；二是可以从收入构成的角度很方便地进行分解分析；三是能够结合人口分布因素来计算地区不平等的程度；四是进行基尼系数的产业分解比加权变异系数方法更方便。　　　　二、四川省区域经济差距测量　　　　首先计算四川省各地区间总的人均GDP的变异系数，计算公式如下：　　　　　　pi为i地区的人口数，Xi为i地区的人均GDP,N为全省地区数，p为全省人口总数，X[TX-]为全省人均GDP。2003年四川省各地区间加权人均GDP的变异系数计算结果为：V=0.72。与我国从年的平均变异系数0.722相当。　　再分别计算各个地区的人均收入的相对偏离贡献率，其计算公式为：　　　　计算结果如表1所示：　　表12003年四川省城乡收入差距指标地区总人口非农业　　　　资料来源：《四川省2003年统计年鉴》，部分数据由统计年鉴中数据计算得来。　　从表中的计算结果可以看出：成都的人均GDP最高，达到了17915元，是巴中市人均GDP 3040元的近六倍。成都、攀枝花、德阳、绵阳四个城市的人均GDP远远高于其他城市和地区，属于工业基础较发达的地区，除巴中、广元、南充外，其他城市和少数民族自治区的人均GDP水平较为接近。农村居民人均纯收入除了阿坝藏族自治州、甘孜藏族自治州、凉山彝族自治州三个少数民族自治地区外，收入较集中分布在2000元—3000元之间，最高的是成都3655.7元。这说明四川省内农村居民收入总体水平较低，地区之间差距较小。城乡居民收入差距较高的是三个少数民族地区，城乡收入比最高达到了6.26∶1，最低达到2.55∶1也高于其他城市，这主要是因为三个自治州的人口较少，工业基础薄弱，城乡差距明显。其他地区的城乡收入差距比主要集中分布2—3∶1左右。成都的城乡收入差距之比达到2.41∶1，其他城市地区城乡收入差距最高的是巴中，达到3.43∶1,最低的是遂宁2.01∶1。我国从1994年开始，城乡之间收入差距出现了下降的趋势，但是从1997年起又逐步扩大。2001年居民的人均收入几乎是农村居民的3倍。如果把非货币因素考虑进去，我国的城乡收入差距将会达到3.5∶1。与近期我国城乡收入差距扩大的趋势相比，四川省平均城乡收入差距比例达到3.15∶1，与2001年我国城乡收入差距的比例相似。　　从地区人均收入偏离全省平均水平份额来比较分析，成都市的人均收入水平远远高于四川省内其他地区，它和攀枝花、德阳、绵阳属于发达地区，除攀枝花外，德阳、绵阳位于成都市周边南北纵向延伸线上，受成都经济辐射带动作用较强，城市化水平与经济发展水平高。攀枝花主要是矿产与能源工业基地，城市与经济发展速度较快。而雅安、自贡、乐山、宜宾分布在川南与川东北地区，农业生产条件较好，工业有一定的基础，但长期发展较缓慢，经济积累不足，城市化水平低。泸州、遂宁、内江、眉山主要由于矿产资源贫乏，工业基础较弱，工业化水平落后。最后广元、南充、广安、巴中、甘孜、凉山等属于落后地区，这些地区是全国、全省重点贫困地区，交通不发达，经济以农牧业为主，工业化水平和城市化水平低。　　从相对偏离贡献率来分析比较，贡献率越大，城乡经济发展水平差距越明显，与平均水平差距越大；相反，贡献率越小，城乡经济发展水平越低，城乡差距不明显。比较贡献率可以看出，成都的贡献率最高，城乡经济发展差距很明显，收入差距大，攀枝花市排在第二位，而其他地区城乡经济发展水平差距不明显，其中自贡市的城乡差距贡献率几乎为0。总的来说，四川省城乡收入差距不很悬殊，除少数城市外，人均收入的总体水平比全国低，城市化水平较低。　　以地市州为基本的地理单元，四川省经济发展水平的区域差异主要表现为中高周低，以成都平原为中心，与绵阳、德阳、雅安地区、乐山南北连成一片，交通发达、工业基础较好，组成成都大平原经济发展区，发展水平最高，成为四川省经济发展的增长极核，由此向四周经济发展水平逐次下降。四川省经济发展水平高低的空间变化大体与四川省地形从平原到丘陵、到山地和高原的海拔高度变化成负相关关系。而攀枝花作为全国著名的能源与矿产基地，虽然经济发展水平较高，但其经济的辐射作用小于成都的作用。　　　　三、四川省区域经济差异的空间结构　　　　为了进一步认识四川省区域差距的结构，采用泰尔指数的分解方法将四川省2003年收入差距分解成地区内的收入差距和地区之间的收入差距。以总体差距为100%计算，分别观察各个差距形成中所占的贡献份额。泰尔指数的分解如下：[2] 　　　　最后计算泰尔指数：I=|IW IB|=|-0.148 0.058|=0.09,计算结果可得：四川省区域经济差异的地区间贡献份额为-14.8%，地区内的贡献份额为5.8%，泰尔指数的绝对值达到0.09。地区间差距的贡献份额超过了地区内的贡献份额的两倍多，这证明了四川省地区经济差距的主要是由于地区间差距较明显。与我国1978年—2002年的泰尔指标相比较，低于全国平均泰尔指数0.112，[3]但是四川省地区间的贡献份额的绝对值14.8%高于全国地区间的平均水平14.63%，地区内的贡献份额5.8%低于全国的平均水平6.6%。　　四、基尼系数分解方法　　为了进一步了解四川区域之间产业的差距，本文采用基尼系数产业分解法，其公式为：[4]：　　　　其中，G为总的基尼系数，Ck为分项集中率（也即分项基尼系数），μK,μ分别代表平均分项和人均总收入。SkCk/G×100%表示第K项产业收入对基尼系数的百分点贡献。本文按三次产业分类，定义[SX(]CK[]G[SX)]为相对集中系数，如该系数大于1，表示对基尼系数起促进作用。以上文表1为基本数据计算，结果如下：　　CK=0.26，总的基尼系数G=0.257.分别计算出的三次产业的相对集中系数为：0.805（第一产业）；1.616（第二产业）；1.470（第三产业）。由上述可知第二和第三产业系数大于1，对基尼系数起促进作用。最后依次求出第K项产业对基尼系数的贡献份额为：第一产业对基尼系数的贡献份额是20.7%；第二产业对基尼系数的贡献份额是41.5%；第三产业对基尼系数的贡献份额是37.8%。　　本文为全文原貌　未安装PDF浏览器下载安装　原版全文　　从计算结果可以看出：四川省区域之间产业差距的形成主要是由于第二和第三产业的差距缘故。区域产业差距较明显，基本形成成都—德阳—绵阳经济圈为中心，以第二和第三产业为主导的产业发展结构，但是以农牧为主的第一产业仍然占据着较大的份额，这也说明四川进入了工业化中期阶段，相比东部发达省份，处于落后水平。因此，加强产业结构调整，加快城市化进程，发展农业经济是四川经济发展的重点。☆ 　　　　主要参考文献：　　[1]林毅夫,蔡日方,李周．中国经济转型时期的地区差距分析[J]．经济研究，1998(6)．　　[2]邓翔．中国地区经济差距的分解及其启示[J]．四川大学学报（哲学社会科学版），2002(2)．　　[3]陈秀山．我国1978——2004年区域差距变动衡量指标[J]．中国社会科学，2004(5)．　　[4]魏后凯．经济增长、制度变迁与地区差距[M]．北京：经济管理出版社，1997．　　　　Quantitative Study on the Regional Economic Differnece in Sichuan Province 　　Liu Yang1 Ju Wei 2 Zhai Youlong3Abstract:Sichuan is the important province of western region to develop in China, and its regional development is not in balance.This paper adopts variation coefficient, the THEIL indexmethod and Gini coefficients to analyze the difference of the district in the region,then makes use of the method of decomposition to research differences between each region in the province.In the end,the authors propose some suggestions for the balanced regional development. 　　Key words:Theil I variation Index 　
泉引九带清冽水&&月照山海长动人
感谢你的迅速回复，内容繁多，需要慢慢吸收，EXCEL能通过数字直接计算出泰尔系数吗？
不是所有理想，都甘愿被折掉翅膀···
你好，我最近在写新疆东、南、北疆的县级财政地域差异性分析。用区域总人口及财政收入算泰尔指数。想问下地区间和地区内的泰尔指数具体怎么算。我用Excel算出有负值，不知道是不是对公式的理解有误。如果算东疆的泰尔指数是不是把人口和财政收入值带进公式，然后依次把南疆北疆算出后三者加权，就是新疆的泰尔指数？&&
可以计算。直接用EXCEL就能计算，Theil index: GE(1)=w1*log(w1/e1)+w2*log(w2/e2)+…+wg*log(wg/eg)，其中wg表示第g组收入占总收入的比重，eg表示g组人口数占总人口数的比重
热心帮助其他会员
总评分:&经验 + 10&
论坛币 + 10&
matlab-007 发表于
可以计算。直接用EXCEL就能计算，Theil index: GE(1)=w1*log(w1/e1)+w2*log(w2/e2)+…+wg*log(wg/eg)，其中 ...您好请问各省的总收入数据可以在哪里获取呢？
特级荣誉勋章
特级荣誉勋章
初级热心勋章
初级热心勋章
中级热心勋章
中级热心勋章
初级信用勋章
初级信用勋章
初级学术勋章
初级学术勋章
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师苹果/安卓/wp
积分 375, 距离下一级还需 75 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡下一级可获得
道具: 抢沙发
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
悲催签到天数: 9 天连续签到: 1 天[LV.3]偶尔看看II
本帖最后由 wanghaidong918 于
04:43 编辑
泰尔指数的计算怎么算，有没有具体的案例介绍具体过程的，网上只是介绍公式和结果，还是有点搞不太明白，谢谢了
载入中......
根据林宏、陈广汉在2003年的《统计与预测》中发表的文
章介绍，泰尔指数是由泰尔(THEIL，1967)利用信息理论中的熵
概念来计算收入不平等而得名。假设U是某一特定事件A将
要发生的概率，P(A)=u。这个事件发生的信息量为E(U)肯定是
u的减函数。用公式表达为：E(U)=log(t／u)。当有n个可能的事件
l，2，⋯n时，相应的概率假设分别为tl。，u2，⋯u。，Hi≥0．∑Hi=1。
熵或期望信息量可被看作每一件的信息量与其相应概 ...
.cn/s/blog_e8ef033d0101o2vy.html 更多内容可参考：
http://bbs.pinggu.org/forum.php?mod=viewthread&tid=1391996&highlight=%CC%A9%B6%FB%D6%B8%CA%FD
本帖被以下文库推荐
& |主题: 12506, 订阅: 29
同问！看了一圈论坛没有啥收获！
根据林宏、陈广汉在2003年的《统计与预测》中发表的文
章介绍，泰尔指数是由泰尔(THEIL，1967)利用信息理论中的熵
概念来计算收入不平等而得名。假设U是某一特定事件A将
要发生的概率，P(A)=u。这个事件发生的信息量为E(U)肯定是
u的减函数。用公式表达为：E(U)=log(t／u)。当有n个可能的事件
l，2，⋯n时，相应的概率假设分别为tl。，u2，⋯u。，Hi≥0．∑Hi=1。
熵或期望信息量可被看作每一件的信息量与其相应概率
乘积的总和：
n(i1)=∑Uih(Ui)=∑uilog(I／U．)
显然，n种事件的概率U．越趋近于(1／n)，熵也就越大。在
物理学中，熵是衡量无序的标准。如果ui被解释为属于第i单
位的收入份额，E(u)就是一种反映收入分配差距不平等的尺
度。收入越平均，E(u)就越大。如果绝对平均，也就是当每个u；
都等于(1／n)时，E(u)就达到其最大值logn，泰尔将logn—E(u)
定义为不平等指数，也就是泰尔熵标准：
T=logn—E(U)=∑uilogn一∑uitog(1／ui)=∑Uilog(nui)
由上式可推出泰尔指数的取值区间，为fO，logn]。因E(u)为
泰尔指数的减函数，当E(u)达到最大值logn时，即收入绝对平
均，每个人的收入都完全相等的情况下，泰尔指数取最小值为
0；当E(u)达到最小值0，即收入绝对不平均的情况下，泰尔指
数取得最大值logn。由此可看出，泰尔指数数值越大，收入分配
越不平均。
泰尔熵标准只是普通熵标准(generalized entropy measures)
的一种特殊情况，在所有的差距测度方法中，普通熵标准指数
是唯一满足可分解性的差距测度方法(Shorrocks，)，
它的表达式如下：
Z f(Yi)l。g(yJu)c=0
∑f(yi)(y／u)109(y／u)c=1
∑f(y．【y加)】c一1)c≠o，1
在(1)中，是y；第i个样本的收入，11是总样本的平均收入
值，f(y；)是第i个样本人口占总样本人口的比重，参数c代表赋
予不同收入分配组不同的权重。当c=O时，指标为MLD(the
mean log deviation)指数，其给予低收入组的差距以较大权重；当
c=l时，指标为泰尔指数，通常用T(1)表示，其给予不同收入组
的权重相同；当C≠0，1时，取值越高，其给予更高收入组的差距
权重越多。
xrong99 发表于
同问！看了一圈论坛没有啥收获！急求&&啊！！！！！哪位高手指点一下啊！
本帖最后由耕耘使者于
11:54 编辑
更多内容可参考：
thank you so much~
总评分:&学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
可以只算一个省的泰尔指数吗？
学习一下高手说明一下
泰尔指数的有没有值域？
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师关注今日：0 | 主题：117237
微信扫一扫
【原创】泰尔指数计算的SAS宏实现
页码直达：
这个帖子发布于5年零87天前，其中的信息可能已发生改变或有所发展。
泰尔指数（Theil Index）是计量经济学家Henri Theil提出的最初用来测度经济不平等性的经济指标[1]。相对于基尼系数、洛伦兹曲线等测度指标，泰尔指数最大的特点在于其可分解性，可以拆解成加权的组内差异和组间差异，因此可以更直观的反映出差异的来源及其大小。泰尔指数在卫生领域有着巨大的应用前景，不少学者将其用于健康、卫生资源配置、卫生服务利用等的公平性或差异的测量。鉴于泰尔指数拆分的复杂性，不少学者未能充分利用这一特性，本文使用SAS/SQL模块以SAS宏的形式实现泰尔指数的计算，以供其他研究者参考。1.泰尔指数计算公式总泰尔指数：（1）总泰尔指数，由亚组之间差异的泰尔指数和各亚组内差异的泰尔指数组成。亚组间差异的泰尔指数：（2）公式2中，n为总组数，为第i组人口规模，为n组总人口规模，为第i组目标元素数量，为n组目标元素的总量。亚组内差异的泰尔指数：（3）公式3中，m为组i中的亚组数目，为亚组p的人口规模，为亚组p中目标元素数量。2.SAS宏设计宏TheilIndex(dataset,subgroup,pop,int)中，dataset代表要进行分析的数据表名称，subgroup为泰尔指数进行分解的亚组，pop代表人口规模，int代表将要分析的目标元素。程序如下：%macro TheilIndex(dataset,subgroup,pop,int);/*计算亚组合计值*/create tabletemp1 as
select &subgroup, sum(&pop) as sub_tot_pop,sum(&int) as sub_tot_int
from &dataset
group by &/*计算总合计值*/create tabletemp2 as
select sum(&pop) as tot_pop, sum(&int)as tot_int
from &/*计算亚组内泰尔指数ti3*/create tabletemp3 as
select &subgroup, sum(ti1) as ti3
/*计算亚组内泰尔指数各成分ti1*/
select temp1.&subgroup, &pop/sub_tot_pop*log((&pop/sub_tot_pop)/(&int/sub_tot_int))as ti1
from temp1, &dataset
where temp1.&subgroup = &dataset..&subgroup
group by &/*计算亚组间泰尔指数各成分ti2*/create tabletemp4 as
select temp1.&subgroup, sub_tot_pop,
tot_pop, sub_tot_pop/tot_pop*log((sub_tot_pop/tot_pop)/(sub_tot_int/tot_int))as ti2
from temp1,temp2;/*合并亚组内泰尔指数和亚组间泰尔指数各成分数据*/create tabletemp5 as
select temp4.&subgroup, ti2, ti3,ti3*sub_tot_pop/tot_pop as ti4, /*ti4为计算亚组内泰尔指数对总泰尔指数的贡献率*/ ti2+ti3*sub_tot_pop/tot_pop as ti5 /*ti5为计算各亚组对总泰尔指数的总贡献率*/
from temp3, temp4
wheretemp3.&subgroup=temp4.&/*计算总泰尔指数并提交汇总报告*/proc reportdata=temp5
column &subgroup ti2 ti4 ti5;
define &subgroup/
define ti2/sum '组间差异贡献值';
define ti4/sum '组内差异贡献值';
define ti5/sum '亚组总贡献值';
rbreak after /proc reportdata=temp5
column &subgroup,ti3 ti4 ti2 ti5;
define &subgroup/
define ti2/sum '组间差异';
define ti3/sum '各组差异';
define ti4/sum '组内差异';
define ti5/sum '总差异';%mend;3.实例数据集及结果解释由于相关文献对原始数据报道较少，本文以2010《山东卫生统计年鉴》中乡镇卫生院执业（助理）医师在划分为东、中、西部地区的17个地市中的分布情况为例进行举例，数据见表1。表1山东各地区农村人口数及乡镇卫生院执业(助理)医师数
4300 执行上述宏TheilIndex()之后，通过proc report程序输出表2，表3两个报表。泰尔指数越接近零，说明差异越小、公平性越好。表2是总泰尔指数在三个地区，组内组间差异的完全分解构成；横向合计为组内、组间的差异，构成总泰尔指数；纵向合计为三个地区各自的总贡献构成总指数。对泰尔指数进行分解分析，可以很容易识别差异集中点。表3则展示了便于进行后续比较的参数，各地区各自的差异，以及组内、组间、总差异，结果应用实例见[2]，绘图实例见[3]。表2泰尔指数的分解构成
0.052697* * 一为总泰尔指数表3泰尔指数统计
4.讨论本文使用了SAS/SQL语言进行了分析过程中的数据整理和计算。SAS/SQL语言是SAS高级编程中经常用到的查询语言，但具有简洁易用的特点。使用SQL查询语句，可以同时对多个表进行合并，并跨表查询、计算；利用SQL创建表格的功能，可以更容易的输出汇总表格；SQL的嵌套查询，可以加强程序的结构化和可读性；合理使用SAS/SQL语言，可以避免data步对全表操作时众多的循环语句，减少错误的发生，提高工作效率。本宏使用时，只需替换包括数据集（表名）在内的四个参数即可。若对整组数据进行分析，不进行亚组拆分，则需在数据集中设置一个常数列，将其名称设为subgroup。如此，计算结果将只有组内差异，无组间差异。参考文献：[1]H.Theil.Economics and Information Theory. Amsterdam, North-Holland.1967.[2]龚向光,胡善联. 卫生资源配置的公平性分析. 中华医院管理杂志,-77.[3]张彦琦,唐贵立,王文昌,等. 基尼系数和泰尔指数在卫生资源配置公平性研究中的应用. 中国卫生统计,3-246.
不知道邀请谁？试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
有人使用过这个么？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园}

我就爱股票网