摘要: 当有多个数据库中的一张表具有类似的数据,例如有多个不同的系统来源,数据插入不同数据库中的表。此时,若需要把这些表数据汇总成一张表进行统计分析,会面临一个棘手问题:由于多张表具有相同的主键,直接汇总到一起会出现主键重复。而 Apache SeaTunnel 就能巧妙应对这一挑战。本篇文章将详细阐述 Apache SeaTunnel 是如何解决此问题的。 阅读全文
posted @ 2026-07-01 14:48 ApacheSeaTunnel 阅读(45) 评论(0) 推荐(0)
摘要: 本文档详细介绍如何使用 Docker 部署 SeaTunnel 2.3.11,并配置 Kafka 虚拟表、数据源以及 Kafka 同步到 Hive 和 Elasticsearch 的完整实战案例。 安装准备 目录结构 seatunnel-docker/ ├── docker-compose.yml 阅读全文
posted @ 2026-07-01 14:29 ApacheSeaTunnel 阅读(8) 评论(0) 推荐(0)
摘要: 6月10日,由 AMD 主办的“芯联生态·智合共赢”2026 AMD EPYC 行业生态峰会——深圳站制造业专场成功举办。作为 DataOps 领域的重要技术服务商,白鲸开源受邀出席本次峰会,与来自制造业、人工智能、高性能计算及产业生态领域的专家学者、企业代表齐聚一堂,共同探讨算力驱动智能制造发展的新路径。 阅读全文
posted @ 2026-06-25 15:44 ApacheSeaTunnel 阅读(6) 评论(0) 推荐(0)
摘要: 此前,我在 Apache SeaTunnel 中曾处理过一个问题:用户执行 Cancel 操作后,任务有时会一直停留在 CANCELING 状态,无法结束。 阅读全文
posted @ 2026-06-25 15:26 ApacheSeaTunnel 阅读(116) 评论(0) 推荐(0)
摘要: 最近在看 Apache SeaTunnel Zeta Engine 的 REST API 认证逻辑时,遇到一个很典型的问题: 阅读全文
posted @ 2026-06-25 15:00 ApacheSeaTunnel 阅读(11) 评论(0) 推荐(0)
摘要: 如果有一天,在 WhaleStudio 中创建同步任务、编写 SQL、搭建 DAG、排查任务异常这些工作都能交给 Agent 自动完成,那么数据工程师的价值还体现在哪里?未来的数据平台又该扮演怎样的角色? 阅读全文
posted @ 2026-06-17 17:42 ApacheSeaTunnel 阅读(10) 评论(0) 推荐(0)
摘要: 本次演示将结合 Apache SeaTunnel 与 Apache DolphinScheduler,实现一个典型的离线增量同步场景:通过 DolphinScheduler 获取目标端同步位点,并将该位点作为参数传递给 SeaTunnel,从而实现 MySQL 到 Doris 的增量数据同步。 阅读全文
posted @ 2026-06-17 16:07 ApacheSeaTunnel 阅读(165) 评论(0) 推荐(1)
摘要: 本次演示将结合 Apache SeaTunnel 与 Apache DolphinScheduler,实现一个典型的离线增量同步场景:通过 DolphinScheduler 获取目标端同步位点,并将该位点作为参数传递给 SeaTunnel,从而实现 MySQL 到 Doris 的增量数据同步。 阅读全文
posted @ 2026-06-17 15:32 ApacheSeaTunnel 阅读(10) 评论(0) 推荐(0)
摘要: 感谢 Snowflake 这次邀请我以 Snowflake 雪花大使身份参加 Snowflake Summit。这次大会给我的触动比预想中更大,大家知道,我一直做从事数据行业,早期在 Teradata,后来在 IBM,后来在企业里 Lenovo、中金、万达等管大数据,后来成为 Apache Software Foundation Member,现在是白鲸开源 CEO,所以我一直对数据行业非常关注。 阅读全文
posted @ 2026-06-10 18:12 ApacheSeaTunnel 阅读(109) 评论(0) 推荐(0)
摘要: 随着生成式 AI 技术的发展,企业对数据基础设施提出了新的要求。除了传统的结构化数据之外,文本、图片、音频等多模态数据正在快速增长。面对更加丰富的数据类型和更加复杂的数据链路,如何构建统一、高效且易于治理的数据通道平台,成为许多企业关注的重要课题。 阅读全文
posted @ 2026-06-10 17:58 ApacheSeaTunnel 阅读(21) 评论(0) 推荐(0)