摘要: 公司内部的大数据架构师提出的架构中,分为两层。 第一层叫数据湖,基本原则按照数据源格式存储所有数据。第二层叫Data Hub,存储加工处理后的数据。供应用层是应用。 数据湖内部又可以分为三个层: 第一层: 原始数据层,这个层是个临时数据存储层,只是临时存储从数据源采集的数据。转入下一层后,就被删除了 阅读全文
posted @ 2021-12-12 21:11 ZH谢工 阅读(4038) 评论(0) 推荐(0)
摘要: 问题: 生产过程数据主要存放在MES系统中,例如订单的最新生产情况,产量数据,问题Lot情况等。对于大数据分析,业务部门希望可以基于及时的数据进行分析展示。 但是MES系统的数据不仅包含仅有insert的历史数据表,同时有很多包含Insert/Update/Delete的事务表。如何将这些数据加载到 阅读全文
posted @ 2021-11-25 11:25 ZH谢工 阅读(169) 评论(0) 推荐(0)
摘要: 1, 大数据可以用于人才管理(录,离,升,降,调)。 招聘时候根据简历内容自动给出测试题,机器自动过滤,判单候选人是否适合公司的岗位,适合什么岗位,根据大数据分析,可以提前3个月预测人员是否会离职,提前采取留人措施。 问题:收集什么样的员工数据,以及如何收集这些数据,来预测人员是否会离职? 2. C 阅读全文
posted @ 2021-10-28 22:24 ZH谢工 阅读(93) 评论(0) 推荐(0)
摘要: SnappyData(也叫TIBCO ComputeDB)是一个分布式的内存数据库,是一个内存优化的分析型数据库。SnappyData为统一的数据分析负载提供了高吞吐量,低延时,高并发的特性。 阅读全文
posted @ 2021-10-20 17:59 ZH谢工 阅读(35) 评论(0) 推荐(0)