摘要: 数据分析的基本思路和流程 阅读全文
posted @ 2020-10-22 18:03 辰令 阅读(296) 评论(0) 推荐(0)
摘要: 机器学习_调包工具对比 Python Spark Flink的机器学习工程实现对比和联系 阅读全文
posted @ 2020-10-21 20:04 辰令 阅读(1273) 评论(0) 推荐(0)
摘要: Spark的内存模型,以及针对内存的调优和对数据倾斜的观察-定位和解决整个流程 阅读全文
posted @ 2020-10-15 20:10 辰令 阅读(598) 评论(0) 推荐(0)
摘要: Spark内存溢出- OutOfMemoryError memoryOverhead 阅读全文
posted @ 2020-10-14 20:10 辰令 阅读(13953) 评论(0) 推荐(0)
摘要: 数据存储和交互Hbase 阅读全文
posted @ 2020-10-09 18:52 辰令 阅读(271) 评论(0) 推荐(0)
摘要: 数据服务,将数据的能力扩展出去,以更简单便捷的方式服务更多的人 阅读全文
posted @ 2020-10-09 18:51 辰令 阅读(520) 评论(0) 推荐(0)
摘要: Spark中行列转换,数据透视(Pivot),宽表和长表的变换 阅读全文
posted @ 2020-09-29 18:21 辰令 阅读(855) 评论(0) 推荐(0)
摘要: Python解析sql提取表,提取表名 阅读全文
posted @ 2020-09-29 18:20 辰令 阅读(3398) 评论(0) 推荐(1)
摘要: 通过实现SQL类似的功能,处理收集数据,数据预处理,数据计算汇总等流程,了解相应的数据处理流程和技术手段。 阅读全文
posted @ 2020-09-27 19:00 辰令 阅读(1117) 评论(0) 推荐(0)
摘要: 通过SparkUI来了解Spark执行的情况以及时间和空间的花费 阅读全文
posted @ 2020-09-27 18:58 辰令 阅读(2176) 评论(0) 推荐(0)