R语言可视化:ggplot2冲积/桑基图sankey分析大学录取情况、泰坦尼克幸存...
发布网友
发布时间:2024-10-23 05:17
我来回答
共1个回答
热心网友
时间:2024-11-08 18:07
冲积/桑基图是数据可视化的一种重要形式,用于展示数据的流向和累积。冲积图的典型元素包括正如下一节中的例子所示,这些元素中哪些被纳入冲积图,取决于基础数据的结构和创建者希望图中传达的内容。
冲积/桑基图数据有三种格式。第一种是宽格式数据,每一行都对应于在每个变量上取一个特定值的观察队列,每个变量都有自己的列。另外一列包含了每一行的数量,如队列中的观察单元数,可用于控制层的高度。宽格式数据适用于基础函数as.data.frame()转换频率表的格式,例如3维的大学录取情况数据集。这种格式:用户声明数量的轴变量,识别并处理。各层之间没有插入空隙,所以图的总高度反映了观测值的累积数量。这种格式和功能对很多应用都很有用。
第二种是长格式数据,包含了每一节的一行,变成一个键值对,编码轴为键,层为值的列。这种格式需要一个额外的索引列,将对应于一个共同队列的行连接起来,即一个冲积层的结点。长格式数据在宽格式和长格式之间转换数据的函数中使用,同时使用一套不同的位置美学接收这种格式的数据。
在难民数据分析中,分层没有包含比冲积层更多的信息,因此通常不会被绘制。在一个例子中,难民数据集中的国家按地区分组,以比较不同规模的难民数量。长格式数据允许我们指定沿同一冲积层的不同轴线变化的美学,对重复测量数据集很有用。需要为每个冲积物生成一个单独的图形对象。
学术课程分析中,使用一组学生在几个学期内的学术课程的变化。分层高度y没有被指定,所以每一行都被赋予单位高度。这个例子展示了处理缺失数据的一种方式。缺失数据的处理(特别是层的顺序)也取决于层变量是字符还是因子/数字的。最后,提供了汇总相邻轴之间流量的选项,演示了流感疫苗调查的数据。
冲积图的流行应用还包括R语言动态图可视化、R语言生存分析可视化分析、Python数据可视化-seaborn Iris鸢尾花数据、r语言对布丰投针(蒲丰投针)实验进行模拟和动态、R语言生存分析数据分析可视化案例、r语言数据可视化分析案例:探索brfss数据数据分析、R语言动态可视化:制作历史全球平均温度的累积动态折线图动画gif视频图、R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告、python主题LDA建模和t-SNE可视化。