上一页 1 2 3 4 5 6 7 8 9 10 ··· 29 下一页
  2021年3月17日
摘要: 本文基于 flink 1.12.0 之前尝试了一下 flink sql 的 去重和Top n 功能,只是简单的看了下官网,然后用 sql 实现了功能,但是还有些疑问没有解决。比如:不使用 mini-batch 模式,去重的结果很单一,降序就只输出第一条数据(升序就一直输出最后一条) 为了解决这些疑问 阅读全文
posted @ 2021-03-17 21:12 Flink菜鸟 阅读(1872) 评论(0) 推荐(1)
  2021年3月9日
摘要: 在大数据的处理过程中会出现很多汇总类指标的计算,比如计算当日的每个类目下的用户的订单信息,就需要按类目分组,对用户做去重。Flink sql 提供了 “去重” 功能,可以在流模式的任务中做去重操作。 官网文档 去重 官网链接: [去重](https://ci.apache.org/projects/ 阅读全文
posted @ 2021-03-09 17:08 Flink菜鸟 阅读(3870) 评论(0) 推荐(1)
  2021年2月20日
摘要: 本文参考官网 Table & SQL Connectors JDBC SQL Connector https://ci.apache.org/projects/flink/flink-docs-release-1.12/dev/table/connectors/jdbc.html#lookup-ca 阅读全文
posted @ 2021-02-20 09:41 Flink菜鸟 阅读(4447) 评论(0) 推荐(1)
  2021年1月14日
摘要: 参考官网: https://ci.apache.org/projects/flink/flink-docs-release-1.12/zh/dev/table/connectors/kafka.htmlhttps://ci.apache.org/projects/flink/flink-docs-r 阅读全文
posted @ 2021-01-14 17:41 Flink菜鸟 阅读(5256) 评论(0) 推荐(1)
  2020年12月22日
摘要: 参考文档: 编译Flink 1.9.0 https://chuna2.787528.xyz/Springmoon-venn/p/11512136.html 编译环境: ubuntu 18.05Java : 1.8.0_271 官网下载源码包:https://mirrors.tuna.tsinghua.e 阅读全文
posted @ 2020-12-22 19:50 Flink菜鸟 阅读(1263) 评论(0) 推荐(1)
  2020年12月19日
摘要: 参考前文:解决 Flink 1.11.0 sql 不能指定 jobName 的问题 从 FLink 1.11 改版 sql 的执行流程后,就不能和 Stream Api 一样使用 env.execute("JobName") 来指定任务名 看了源码后发现,在 sql 任务中,直接使用了 "inser 阅读全文
posted @ 2020-12-19 11:53 Flink菜鸟 阅读(6317) 评论(1) 推荐(1)
  2020年12月17日
摘要: 本文来自官网: https://flink.apache.org/news/2020/12/10/release-1.12.0.html 2020年12月10日Marta Paes(@morsapaes)和Aljoscha Krettek(@aljoscha) Apache Flink社区很高兴地宣 阅读全文
posted @ 2020-12-17 10:25 Flink菜鸟 阅读(1151) 评论(0) 推荐(1)
  2020年12月9日
摘要: 注: 所有内容都基于Flink 本地模式 JobGraph 的生成是从 LocalExecutor.java. execute 方法开始的 // 本地执行调用 Pipeline 是 StreamGraph 的父类 @Override public CompletableFuture<JobClien 阅读全文
posted @ 2020-12-09 20:44 Flink菜鸟 阅读(1121) 评论(0) 推荐(1)
摘要: Flink 任务的图结构中,部分算子是 chain 在一起的,因为 chain 在一起有很多好处(减少序列化和网络开销,提高效率),而算子 chain 在一起是需要条件的 Flink 任务在生成 JobGraph 的时候,会加入 chain 的概念,会判断算子能否 chain 在一起 首先在 env 阅读全文
posted @ 2020-12-09 18:59 Flink菜鸟 阅读(1136) 评论(0) 推荐(1)
  2020年11月6日
摘要: Flink StreamGraph 的核心是 streamNodes 包含所以 算子生成的 StreamNode(也叫 Vertex), StreamNode 中包含连接算子的边(Edge),其他的虚拟节点 使用 virtualSelectNodes、virtualSideOutputNodes、v 阅读全文
posted @ 2020-11-06 15:43 Flink菜鸟 阅读(666) 评论(0) 推荐(1)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 29 下一页