摘要:
领导突然说要做高质量数据集时,会议室里通常会出现一种很熟悉的沉默。 业务同学先看产品,产品看算法,算法看数据,最后大家一起看向数据团队。 “我们是不是先整理一批样本?” “要不要找人标注?” “有没有现成的数据可以直接拿来训练?” 这些问题都没错。但如果第一步就从“找样本、做标注、建文件夹”开始,这
阅读全文
posted @ 2026-06-01 09:00
拾穗数据
阅读(7)
推荐(0)
摘要:
一个做 AI 应用的团队,Demo 演示很顺利。 领导站在会议室前面看了一会儿,问了一句:“能不能接真实业务数据?” 空气突然安静。 不是模型不行,也不是工程师不努力,而是大家都知道,一旦接入真实数据,很多旧问题会一起冒出来:字段口径不统一,样本来源说不清,敏感信息没有标记,历史版本找不到,业务说“
阅读全文
posted @ 2026-06-01 09:00
拾穗数据
阅读(6)
推荐(0)
摘要:
我认识一个做数据分析的朋友,桌面上永远开着三个东西:SQL 编辑器、企业微信和一个不知道被谁维护的 Excel。 他每天都很忙。 上午帮销售拉客户名单,中午修看板口径,下午排查订单数为什么和财务对不上,晚上还要给老板补一版经营日报。公司里很多人都找他,很多问题也确实离不开他。 可是年底绩效的时候,他
阅读全文
posted @ 2026-05-31 09:00
拾穗数据
阅读(3)
推荐(0)
摘要:
周六晚上,做数据平台的人最怕一句话。 “这个东西能不能下周上线?” 这句话听起来平常。可它后面常常藏着一长串没有被说出来的问题:源库能不能稳定同步?Schema 变了谁知道?权限是不是跟着人走?模型上线以后会不会漂?Agent 能不能安全地读企业数据? 本期数据周刊,我按 2026-05-30 晚间
阅读全文
posted @ 2026-05-31 00:10
拾穗数据
阅读(11)
推荐(0)
摘要:
周五下午,一个做数据开发的朋友给我发来一句话: “最近是不是又到了所有人都开始说数据资产的时候?” 我问他怎么了。 他说,上午刚开完一个会。领导先提到 2026 年“数据要素×”大赛,又说公司今年要重视高质量数据集和 AI 应用合规。会议纪要写得很漂亮,落到他这里,变成三件事:看看有没有项目能申报,
阅读全文
posted @ 2026-05-30 23:39
拾穗数据
阅读(18)
推荐(0)
摘要:
周五下午,一个做数据开发的朋友给我发来一句话: “最近是不是又到了所有人都开始说数据资产的时候?” 我问他怎么了。 他说,上午刚开完一个会。领导先提到 2026 年“数据要素×”大赛,又说公司今年要重视高质量数据集和 AI 应用合规。会议纪要写得很漂亮,落到他这里,变成三件事:看看有没有项目能申报,
阅读全文
posted @ 2026-05-30 09:00
拾穗数据
阅读(16)
推荐(0)
摘要:
周一早上,群里突然安静了一下。 领导转来一条新闻,说 2026 年“数据要素×”大赛启动了,又补了一句:“我们今年也要看看数据资产和数据要素这块,有没有能做的项目。” 做数据的人看到这种话,心里通常会有两种声音。 一种声音说,这是机会。公司终于开始重视数据了,数据团队也许能从“取数支持”变成“价值部
阅读全文
posted @ 2026-05-29 23:49
拾穗数据
阅读(3)
推荐(0)
摘要:
有一类需求,数据团队听到之后会本能地紧张。 领导在会上说:“今年公司要重视数据资产,你们先把数据资产盘一下。” 这句话听起来不复杂。甚至很像一个标准数据治理动作:拉表清单,补字段说明,填负责人,做一个目录。 但做过的人都知道,如果第一步就从“盘表”开始,这件事很容易走偏。 最后你会得到一个很大的 E
阅读全文
posted @ 2026-05-29 23:49
拾穗数据
阅读(6)
推荐(0)
摘要:
数据质量问题出现时,很多团队的第一反应是加告警。 空值多了,加一个空值率告警。行数波动了,加一个同比环比告警。任务延迟了,加一个 SLA 告警。指标口径变了,加一个异常监控。告警越来越多,群消息越来越吵,最后大家开始静音。 告警不是没用。没有监控,数据问题只能等业务投诉。 但如果数据质量只靠告警,治
阅读全文
posted @ 2026-05-28 09:00
拾穗数据
阅读(2)
推荐(0)
摘要:
很多数据团队都有过这样的经历:一个看板做了很久,上线时大家都说好,过了两周,打开次数越来越少。 业务还是在群里问数,老板还是让人截图,运营还是让分析师单独拉 Excel。看板明明在那里,指标也不少,筛选器也做了,为什么没人用? 很多人第一反应是:是不是看板不够美观?是不是图表不够丰富?是不是用户不会
阅读全文
posted @ 2026-05-27 09:00
拾穗数据
阅读(2)
推荐(0)