大数据
Hadoop MapReduce思想起源
HDFS 是GFS的开源实现
Azure Blob/Data Lake Storage Gen2
Amazon S3
Ali Oss (S3 Compatiable)
GCP Cloud Storage (S3 Compatiable)
Cloudrea 与 Hortonworks 两家公司
微软的HDInsights的历史 (EMR(AWS-Ali-Tencent))
Azure Databricks
Spark
批处理 vs 流处理
Spark Streaming
Spark Batch
Spark ML
Spark SQL
Hive/Pig/Presto/Hbase
Ganglia (Replaced by Grafana)
Flink
ELK
ElasticSearch
Logstash (Filebeat)
Kibana
Azure Search
数据湖
Delta Lake (Databricks)
增加事务
日志与回滚 TimeTravel
Kudu
中间件
Kafka
Azure EventHub
AWS Kinesis
DataWarehouse
Azure Synpase
SAP Hana
Kyligence