¿Cuál sería el enfoque más eficiente y escalable para diseñar un sistema de procesamiento distribuido que maneje grandes volúmenes de datos en tiempo real, considerando tanto la tolerancia a fallos como la optimización del rendimiento? ( Respuesta corta por favor )​