问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

数学建模笔记——评价类模型之灰色关联分析

发布网友 发布时间:2022-09-05 01:01

我来回答

1个回答

热心网友 时间:2024-10-04 09:37

这一篇就简单介绍一下灰色关联分析吧。灰色关联分析主要有两个作用,一是进行系统分析,判断影响系统发展的因素的重要性。第二个作用就是用于综合评价问题,给出研究对象或者方案的优劣排名。

不过这里我只能简单介绍一下,更加深入的原理,可能需要我专门学习之后才能清楚地表达出来。不过应用起来倒不是很难,部分原理理解不清晰应该也不影响使用,就当作了解一个新方法吧。

事实上越往后学,例如多元回归分析、运筹学相关、时间序列分析、各类预测模型、聚类分类等等,都涉及到很多有难度的数学推导。我自己即使有所理解和学习,但想要比较简单易懂地表达出来,还是需要更长时间沉淀的。所以目前写学习笔记,就只能简单说明一下原理,然后讲一下傻瓜式应用了。等我理解得更加深入了,再回头把写得不够深入清晰的文章翻新一下吧。

好的,言归正传,讲一讲灰色关联分析吧~

“在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。”

以上内容摘自百度,大概就是这么回事。灰色关联分析的研究对象往往是一个系统。系统的发展会受到多个因素的影响。我们常常想知道,在众多的影响因素中,哪些是主要因素,哪些是次要因素;哪些因素影响大,哪些因素影响小;哪些具有促进作用,哪些具有抑制作用等等。

数理统计中常常使用回归分析、方差分析、主成分分析等来探究这个问题。但上述的方法有一些共同的不足之处。例如这些方法都要求大量的数据,数据小则结果没有太大意义;有时候还会要求样本服从某个特殊分布,或者出现量化结果与定性分析不符合的情况。而灰色关联分析则可以较好地应对这种问题。

灰色关联分析对样本量的多少和样本有无规律并没有要求(当然样本量也不能太少,就两、三个样本还分析什么),量化结果基本上与定性分析相符合。灰色关联分析的基本思想是,根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线形状越接近,相应序列之间的关联度就越大,反之就越小。

嗯,对于上述原理,简单翻译一下,就是研究两个或多个序列(序列可以理解为系统中的因素或者指标)构成的曲线的几何相似程度。越相似,越说明他们的变化具有某种紧密的联系,也就是关联度高。所以这个方法也几乎是从纯数据的角度去研究关联性,如果两个没啥关系的指标,在曲线形状上表现得极为相似,那灰色关联分析就会认为二者关联程度很高。当然这只是一个比较极端的例子,对于一般的数据或者系统,用曲线形状来衡量关联度,也是有一定的道理的。

我们首先来介绍一下第一个应用,也是它的基本应用,系统分析。其分析的主要内容,就是给“影响系统发展的各因素”在重要程度或者说影响程度方面排序。用灰色关联分析的说法,就是给出各个因素与系统总体的关联度排序。关联度越高,说明相应因素对系统发展的影响越大。至于关联度,就是上文提到的曲线形状的近似程度了。嗯,其实模模糊糊还是可以理解灰色关联分析的,就是感觉上有一点儿不靠谱hhh

下面直接举个例子来讲解应用灰色关联分析的方法。(原理已经讲过了呀)

下表为某一地区国内生产总值的统计数据(单位:百万元),问该地区从2000年到2005年之间哪一种产业对GDP总量影响最大。

诺,这就是一个典型的系统分析问题,找出对GDP发展影响最大的一个因素。那我们需要怎么做呢?想想看,灰色关联分析的原理是,比较序列曲线几何形状的相似性,那当然要先把序列曲线给画出来呀。嗯,第一步就是画出序列曲线啦。

这里需要注意,我们想要研究各因素对系统总体的关联度,就需要找出一个可以代表系统总体发展的指标,这里就是GDP。类似的,我们想要反映教育发达程度,就可以使用国民平均接受教育的年数来代表;我们想要反映社会治安面貌,就可以使用刑事案件的发生率来表达;想要反映国民健康水平,就可以使用医院挂号次数来表达。不管怎样,总是需要找到一个指标,对系统整体的发展进行刻画。

别的不说,只看曲线形状,我就觉得第一产业对GDP的影响最小了。GDP一直往高处走,而第一产业曲线的形状几乎就是平着的。而单看相似性,好像第二产业,也就是灰色曲线与GDP曲线最为相似。不过画出图像只是为了给出一个直观的感受和分析,曲线形状的近似程度,还是需要计算的。

第二步是确定分析序列。分析序列分为两类,一类称之为母序列,也就是反映系统整体行为特征或发展的数据序列,可以理解为回归分析中的因变量,这里就是GDP这一列。另一类称之为子序列,也就是影响系统发展的因素组成的数据序列,可以理解为回归分析中的自变量,这里就分别是第一产业,第二产业,第三产业的生产总值数据。

第三步是对数据进行预处理。预处理我们讲到许多了,例如正向化,标准化,归一化等等。这里预处理的目的就是去除量纲的影响,以及缩小数据范围方便计算。数据标准化往往就是这个作用。数据标准化有多种方法,例如 标准化,就是原数据减去均值除以方差,随机变量往往使用这种方法;再比如 标准化,就是 。这两个方法之前都提到过。

那在这里,我们使用的标准化方法是每一个元素除以对应指标的均值,也就是 。嗯,我们展示一下处理之后的数据。用excel处理就可以了,比较方便。

第四步,计算处理后的子序列中各个元素与母序列相应元素的关联程度。记母序列为 ,子序列为 , , 。我们首先计算出*序列最小差 ,之后再计算一下*序列最大差 。计算如下表。

嗯,可以发现, 就是上表中最小的元素, 就是上表最大的元素。然后我们就可以计算子序列中每个元素与母序列相应元素的关联度啦。

灰色关联分析中,定义 ,其中 是分辨系数,一般位于 之间,往往取 。至于为什么要用这样一个公式定义子序列某元素与母序列相应元素的关联度呢?我就不晓得了……嗯,自行查阅,如果知道了请留言告诉我,谢谢!

第五步,计算各个序列,也就是指标与系统总体的关联程度。我们定义 ,用它来表达某个指标与系统总体发展的关联度。

嗯,其实就是第四步,求出了指标内部各个元素与母序列对应元素的关联度,把他们求个平均值,就可以看作该指标与系统总体的关联度了。如果你可以接受上文中的关联度计算公式,想来接受这个关联度均值,应该不是太难。

上图就是该题的最终计算结果了,计算证明,取分辨系数为0.5时,第三产业对国内生产总值的影响最大。好像跟那个图片不是很符合……毕竟从图片上直观感受,应该是第二产业的曲线形状与GDP的曲线形状最为相近,结果计算出的是第三产业。那,我们换一下 试试。

一番操作,还是第三产业对GDP影响最大。不过再次提醒,实际使用时, 是最常用的。

如果要强行解释一波,大概就是GDP的增长率是有起伏的,2002-2005之间每一段折线的斜率是不同的,而第二产业2002-2005之间,基本是一条直线过去,相比之下,第三产业的增长变化,更像GDP的变化……好吧就是强行解释一下啦

上图是每一年的增量情况……嗯,好像也是灰色和蓝色更像,不过2003-2005的增量,也就是2002-2005这四年来看,第三产业和GDP的增长更加相似。而第二产业只有一两年比较相似,所以综合来看,可能还是第三产业对GDP的影响更大吧。

嗯,强行解释完毕。

最后对于系统分析问题,还有两个问题。

嗯,系统分析讲到这里。

灰色关联分析用于综合评价的核心是,通过指标的关联度确定每个指标的权重,之后加权求和打分。

还是这二十条河流。评价水质,我们用灰色关联分析怎么做呢?

第一步、把所有指标进行正向化处理。正向化处理知道是什么吧,就是把极小型,中间型,区间型指标,全部转化为极大型指标。也就是要求数据值越大,最后得分越高。

第二步、对正向化的矩阵进行标准化。这里的标准化跟上面系统分析的标准化是一个东西。也就是用每一个元素除以对应指标的均值, ,把数据的范围缩小,消除量纲影响。将经过了上述两步处理的矩阵记为

第三步、将正向化、预处理之后的矩阵,每一行取出一个最大值,作为母序列。嗯,这里就是灰色关联分析用于综合评价问题需要注意的点了,也就是人为的构造出这么一个母序列。

第四步、按之前提到的方法,计算各个指标与母序列的灰色关联度,记为 。

第五步、计算各个指标的权重。每个指标的权重 。也就是关联度占总体关联度之和的比重。

第六步、我们求出每个评价对象的得分。对于第 个评价对象,其得分 。这里的 ,也就是上面提到的经过正向化和标准化的矩阵 。 中的每一个指标都是极大型指标,数值越大分数应该越高,同时消除了量纲的影响。因此我们直接把 中的元素作为每个指标下对每个评价对象的打分,然后对指标的分数进行加权求和。权重就是我们上面使用灰色关联度求得的权重。这样子,我们就求出了最终的分数。

第七步、对分数进行归一化处理。 ,这样子可以把分数全部放在0-1之间。归一化的好处就是,此时的分数可以解释成相应的研究对象在总体研究对象中“水某平”的百分比,也就是所处的位置。在水质题目中,也就是某河流水质情况在所有河流中所处的位置。嗯,用一个更通俗的说法,就类似于“您的成绩超越了百分之xx的同学”。这就是归一化的目的。

下图展示了对于水质情况的评价,使用TOPSIS方法与灰色关联分析的结果。

可以看到,这两种方法对于该问题最后的排序是不同的。第一名的取法就不一样,中间一部分顺序也比较不同,不过总体上还是比较相近的。hhh,不如再使用一个层次分析法,把三种方法得出的归一化后的分数,再取个平均,作为最终排序的依据。嗯,你看这个模型,是不是一下子就复杂了。

好的,本文就到这里,其实还是有几个迷惑的问题没有解决。

后两个好像可以强行解释,因为我们把正向化以及标准化后的矩阵当成分数矩阵了,所以取每一行的最大值,用来构造系统的最优得分序列,每一项方案就相当于系统的一次发展。之后计算关联度,就是看指标对系统最优序列的影响程度,影响程度越大,我们就赋给它更大的权重……嗯,强行解释

上面这三个问题,如果谁有比较好的想法,希望可以留个言告诉我,现在这里谢过!如果我以后慢慢理解了,也会在文章中更新。(不过发在微信公众号上可能是无法更新了,知乎和都可以)

灰色关联分析,我能分享的也就这么多了。如果想要继续了解,可以阅读《灰色系统理论及其应用》,刘思峰等著。嗯,灰色系统还有灰色系统预测,灰色组合模型,灰色决策,灰色聚类评估等应用,没事儿可以看看。

这两天知乎给我推送了一些数学建模相关的问答,其中一个是数学建模相关书籍。我把高赞回答推荐的书的电子版找了一下,如果需要的话,在微信公众号“我是陈小白”后台回复“数学建模书籍”即可。

以上
评价模型 - 灰色关联分析(GRA)

计算灰色关联系数 计算子序列中各个指标与母序列的关联系数。计算关联度 基于关联度计算权重的综合评价 本质是构造虚拟母指标,以各个指标与母指标的灰色关联度代表指标权重,再以此权重对每个观测值做简单加权得到结果为评价。本方法疑是来源清风的数学建模视频,在互联网上流传。与灰色关联分析的决策方法相异...

非结构化数据如何可视化呈现?

通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准...

数学建模笔记——评价类模型之灰色关联分析

“在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。” 以上内容摘自百度,大概就是这么回事。灰色关联分析的研究对象往往是一个系统。

2022数学建模国赛E题思路:灰色关联、主成分回归 、支持向量机建模

在2022年的数学建模国赛E题中,针对中国城乡居民养老保险体系的复杂问题,本文采取了灰色关联、主成分回归和支持向量机等多种建模技术。首先,研究者从现实数据出发,针对城镇居民、新农保和企业年金养老保险,构建了收入与支出的数学模型。模型构建过程中,通过相关分析和灰色关联度分析筛选关键指标,主成分回...

数学建模——常考评价类模型介绍

模糊数学将主观性转化为定量,其系统性强,特别适合处理不确定性。例如,通过隶属度来衡量某品牌零食的评价,综合结果为“一般”。模糊综合评价法的优势在于简便易行且精确,但指标权重的主观性是其潜在问题。同时,TOPSIS方法依赖于距离计算,虽能避免主观性,但选择量化指标的难度不小。灰色关联分析的深探...

数学建模——常考评价类模型介绍

灰色关联分析数据处理要求非负,计算简便,适合灰色系统评价,但系统必须满足灰色系统条件。数据包络分析 (DEA)DEA 评估多输入与多输出指标的效率,通过比较投入与产出,识别有效与无效决策单元。案例分析环保与经济增长关系,识别最优效率与改进方向。DEA 模型类型包括 CCR 模型(技术效率)、BCC 模型(技术...

数学建模模型常用的四大模型及对应算法原理总结

评价模型:层次分析(定性与定量决策的有力工具)与灰色关联(衡量趋势的一致性),以及TOPSIS(优劣势分析,揭示决策的平衡点)。预测模型,尽管未详尽阐述,但多项式拟合(最小二乘法)、Malthusian和Logistic等非线性模型,以及时间序列分析(ARIMA)在预测未来趋势中扮演关键角色。统计模型,涵盖了聚类分析...

数学建模清风老师灰色关联分析模型

数学建模系列笔记5:综合评价和因子分析

和“负理想解”来对多个决策方案进行排序。7. 灰色关联分析方法 灰色关联分析是一种衡量因素之间关联程度的方法,它对样本量的多少没有特别要求,也不需要典型的分布规律。8. 熵值法 熵值法是一种基于指标观测值差异程度来确定权重的客观赋权方法,它可以避免主观因素的干扰,使评价结果更符合实际。

数学建模系列笔记5:综合评价和因子分析

灰色关联分析方法对样本量的多少没有过分的要求,也不需要典型的分布规律,计算量少到甚至可以手算,且不致出现关联度的量化结果与定性分析不一致的情况。利用熵的概念确定指标权重的方法称为熵值法The Entropy method。其出发点是根据某同一指标观测值之间的差异程度来反映其重要程度,如果各被评价对象的某...

数学建模中的评估模型有哪些

数学建模中的评估模型有:1、层次分析法,构造两两比较判断矩阵,单一准则下元素相对权重计算及一致性检验,一致性检验,计算各层元素对目标层的总排序权重;2、灰色关联分析体系;3、DEA评价体系,比率模式,超级效率模式,线性规划模式,超级效率之多阶排序模型;4、模糊数学评价模型。数学建模就是根据实际...

灰色关联分析模型用什么软件 灰色关联分析模型例题 数学建模怎么建立模型 灰色关联预测模型 基于投影的灰色关联模型 基于灰色关联分析 灰色关联分析过时了吗 灰色关联分析代码 灰色关联分析法的产生
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
在韩国怎样申请到电视台观看综艺节目? 中南财经政法大学和西南财经大学哪个的会计学要好,各自就业怎么样... 思享公益丨法学高校巡回中南财专场:直系学姐带来亚洲最大法学院的超全... 中南财大每年推免的比例大概是多少? 英国学生公寓户型全解析 第一次办港澳通行证,湖南人在广东,如果办的话在广东可不可以办? 湖南人第一次可以在佛山办港澳通行证 求CLANNAD动漫图片要渚跟她女儿的图片像这种的要好看的只要多好看悬赏我... 求CLANNAD动画里所有人的图片 91wan街机三国元宝2000个多少? 求dps软件,做灰色关联度用,拜托了,请好心人帮忙~~~ 如何改善瑞幸咖啡销售订单随机跳号现象 在...心中... 造句 笔记本电脑充电器摔了—下对充电有没有什么安全隐患 笔记本充电的时候,突然间充电线不小心突然掉了,笔记本也不会断电... 河北几月开始用蚊帐 康梦宝空调蚊帐的寿命是多长时间? 九洲鹿家纺的蚊帐,使用多长时间需要清洗 对肺部核磁共振检查费是多少 请问肺部和肝脏可以同时做核磁共振吗、得多少钱? 磁共振检查肺部多少钱? 谈谈你对文化全球化内容与实质的理解 一百十几和一百一十几的区别 香蕉叶可以喂草鱼吗? 溯溪对女人的危害 新化粗石溯溪到大熊山有多远 请问这是风车茉莉吗?网上买的,感觉不太像,也不敢确定,希望各位帮忙看一... 朴兴圭是不是凶手 谁能告诉我《杀人回忆》这不电影怎么样呀?说个短评之类的评价! 银联智策是国企吗 ...放假想带特产回去,请问海南有什么特产,海口美兰区哪里卖特产比较便宜... 樟树皮的功效与作用和治疗偏方 小车上贴了字影响审车么 白色汽车贴字怎么样好看 后挡风玻璃贴字可以吗?汽车后挡风玻璃上贴字违法吗 车身贴字怎么审批 求苏宁易购暗号? 励志和鼓励孩子的短句 在注册苏宁易购的app时做推广,输入暗号领取红包,在同一台手机上显示设备... 鼓励孩子的励志名言句子 苏宁易购对暗号领取新人红包的邀请码是多少? 有人知道CIM,OIM,CMW这3个简写表示什么意思吗? HTC T329t多少钱 请问为何在浏览器中可以正常显示curl抓取显示却不完全呢 大赢家机构是骗人的吗 艳山姜的家庭养殖方法 艳山姜的生长习性 为什么我把所有信用卡的分期全部还了后,不但不通分期了,不提不了额度... 十二生肖龙的三合属相是什么 秦皇岛市工伤保险报销比例