Flink与SparkStream区别
目前的环境下,在实时流处理的大数据框架,只有<b>Flink</b>和<b>SparkStream</b>
SparkStream是以<b>批量来模拟流式处理</b>,其带来的就是延迟(spark可达到秒级别延迟,但在某些环境下需要更低的延迟)
Flink是以<b>流实模拟批处理(有界流)</b>,Flink区别Spark最重要的是stateFule有状态计算,Flink提高了内置的对状态一致性处理,任务如果发生了Failover,其状态不会丢失,有多少算多少。
性能对比
Flink是<b>一行一行处理</b>,SparkStream是以<b>RDD</b>(分布式弹性结果集)进行小批量处理,所以spark在处理流式数据方面需要一定的延迟,但Flink与Storm的性能差不多,所以在处理流式数据时Flink会优于Spark