https://bigdataschool.ru/blog/spark-sql-data-structures.html
3 набора данных в Spark SQL для аналитики Big Data: что такое dataframe, dataset и RDD