Spark开发指南

外部数据集

Spark支持的外部数据集包括:本地文件系统、HDFS、HBase、Hadoop InputFormat。

本地文件系统

HDFS

HBase

#