摘要:
Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的版本是1.8.0。 列式存储 列式存储和行式存储相比有哪些优势呢? 当时Twitter的日增数据量达到压缩之后的100TB+,存储在HD 阅读全文
posted @ 2017-01-21 00:11
duanxz
阅读(2256)
评论(0)
推荐(0)
浙公网安备 33010602011771号