https://pschafhalter.com/blog/resilient-distributed-datasets/