发布网友 发布时间:2022-06-01 20:45
共1个回答
热心网友 时间:2023-10-16 03:02
一般来讲,对于陌生的名词,大家的第一个反应都是“What is it?”。 RDD是Spark的核心内容,在Spark的官方文档中解释如下:RDD is a fault-tolerant collection of elements that can be operated on in parallel。由此可见,其中有两个关键词:fault-tolerant & in parallel。首先,容错性是RDD的一个重要特性;其次,它是并行计算的数据。