电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

关于JNH

关于JNH

金年会官网首页入口 直击中枢业务! 得物财务数仓Claude AI Coding应用实战

发布日期:2026-05-28 04:14 来源:未知 作者:admin 浏览次数:

金年会官网首页入口 直击中枢业务! 得物财务数仓Claude AI Coding应用实战

一、序论:财务数仓为什么需要AI?

二、应用场景概览:从「单点提效」到「全链路增强」

三、中枢应用场景深度领会

四、回想与瞻望

一、序论:财务数仓为什么需要AI?

1、财务数仓的相当性

在电商数仓体系中,财务域是复杂度最高、容错率最低的范围。不仅因为财务对于数据准确性的要求高,也因为财务是横向域,与险些通盘的域都罕有据交叉,因此对业务 Sense 的要求很高。财务数仓工程师实质上在作念三件事:

业务翻译:将交往、支付、资金、促销补贴、资本等数十个业务系统的数据,翻译成通用的财务谈话;

金钱架构:从 ODS 到 DWD、DWS、ADS 层层构建,确保财务 UE、财务管报等公司中枢方针算得准、算得快;

质地兜底:GMV 口径是否协调,退款是否扣减,摊派是否跨周期对都,任何一个字段的偏差都可能导致无理的筹画决策。

财务域的私有挑战在于:字段间存在严格的数学公式关系(正向-冲销=冲销之后),业务章程触及跨周期摊派,对于质地的要求极高。要是单纯依靠东说念主工兜底,要么容易出错,要么需要冗余大量东说念主力作念复核。尤其是在委用压力大的时候,质地问题就更容易被冷落。

2、痛点聚焦

从财务数仓的相当性登程,咱们不错回想财务数仓的痛点,大体不错分为如下几类:

基本上,在需求连续的每个环节,都可能因为"东说念主"的问题,带来隐患。

3、AI 大模子能带来什么改变

为了灵验搞定"东说念主"的问题,比如催得太急、看不外来、没看仔细、相识无理等问题,咱们引入 AI 来作念改变。中枢想路是:大模子的介入不是替代数仓建造工程师,而是在「需求相识 → 代码编写 → 质地测试 → 文档千里淀」每个环节注入强推理才调。欺诈 AI 来代替东说念主作念大量的重迭性使命,同期减少初级无理概率。

那么为什么 AI 能作念到这少许?从技能发展的趋势看,有三个中枢才调复旧了这一变革:

超大高下文冲突学问孤岛:200k+ token 的高下文窗口,不错将表结构界说、词根字典、方针计较逻辑一次性注入模子的 “使命纪念”,达成基于全域元数据的推演,让大模子具有纪念;

业务语义的自动抽象与对都:大模子能相识 “日活”“留存率”“归因窗口” 等业务术语,并映射为具体 SQL 达成,减少因需求相识偏差导致的返工;Claude 在编码范围显赫优于其他模子,是因为它能 “懂” 业务逻辑,而不是简便的机械履行;

突破东说念主类极限的范例履行力:东说念主工在蹙迫工期下范例遵照率频繁昭着下落,而大模子注入范例后,可褂讪保管在高位。唯有指示给得明确,大模子 “险些” 不会出错。

参考:亚马逊 AWS 对于构建一个强劲、具备自我纠错才调且能查询多种数据源的 Text-to-SQL 搞定有盘算推算架构图。

二、应用场景概览:从「单点提效」到「全链路增强」

1、场景与提效预期

基于上述不雅点,在财务范围,大模子不错在哪些具体的环节落地呢?以下是字据笔者近期实践西宾,列出的可落地场景及提效预期。

2、东说念主机合营步地:数仓研发的「L3 时刻」

要是借用自动驾驶的分级模范,现时数仓大模子应用正处于从 L2(扶直驾驶)向 L3(有条件自动驾驶)过渡的阶段,即在明确的 Prompt 管理与范例文档复旧下,AI 能继承绝大部分模范化的履行径作。

在财务域的实践中,咱们亦然按照这套自动驾驶分级的方法,将往常使命拆解成了三级:

这种单干背后的逻辑是:范例履行是东说念主类的短板、AI 的长板;业务判断是 AI 的短板、东说念主类的长板。 东说念主工在蹙迫工期下对定名范例、分区管理、留意要求的遵照率频繁昭着下落,且容易因疲困产生遗漏;而 AI 一朝"学会"了团队范例,输出的范例遵照度可褂讪保管在较高水平。反过来,AI 无法替代的是那些需要相识业务高下文、衡量弃取、处理不合的使命。

3、AI 对于数仓全链路研发的提效作用

学习 Andrej Karpathy 对于 ChatGPT 共享的内容时,最大的感受是:AI 最强的才调,是 "泛化"。 因此,要是咱们不错把数仓研发的链路拆分明晰,那么 AI 例必巧合对其中的每一个环节提效,最终带来研发效力的大幅度晋升!

三、中枢应用场景深度领会

1、AI OneData 模范化建模(财务核算数据神态)

1)配景:财务核算 OneData 为什么难搞?

因为:仅第一轮模子假想,就触及百张以上的表、多个子域、十余个业务过程、数百个方针。要是琢磨到后续的二次/三次迭代,使命量例必大到无法想象。在现时以委用为主的阶段,很难破耗如斯多的时候作念基建。以某次核算神态为例,各层表数目散播如下:

同期,财务域的中枢特征是起首多(全公司系统)、方针多(单表字段数稠密),但以可累加方针为主。财务严格道理上莫得原子方针,全是基于业务方针加工出来的派生方针,且一个财务方针不时有多种口径:业务口径、资金口径、财管报口径。况且,神态触及多个子域(核算域、技能资本域、促销补贴域、贸易化域、分析域),澌灭从「计费 → 核算 → 结算 → 财务分析」的端到端业务过程体系。要是要透顶相识核算 OneData 的构建,不仅要懂数仓,还要懂财务,还要纯属公司财务系统,这个要求特等难作念到!主要难点荟萃在四个方面:

①口径溯源极其复杂:大量逻辑在工程侧达成,绝大多数表缺休闲务文档、技能文档、口径文档,口径逻辑需要基于代码计算,存在无理可能性,溯源使命量远大。

②范例履行不一致:财务域触及表定名范例(DIM/DWD/DWS/ADM 各有时势要求)、时候周期范例(1d/7d/30d/wtd/mtd/ytd 等多种)、生命周期范例、刷新周期范例、模范字段英文定名原则({主体}{业务场景}{币种标志}{度量类型}{时候单元})。范例越细,东说念主工遵照率越低。

③跨域依赖复杂:财务是横向域,与各业务域交叉。核算域依赖大量上游表,技能资本域需要从云做事、算法、产研东说念主力、标注东说念主力等多个起首接入数据。

④文档输出繁琐:每个 ADM 表都必须包含 OnePage 文档(OneData 有盘算推算最紧要内容),加上口径文档、模子使用评释、下贱 mapping 文档,文档间大量重迭但需各写一遍。

是以,咱们更需要通过 AI 的才调,来作念一套新期间的建模方法论,以顺应 “低进入、大假想” 的智能建模场景。

2)建模方法论:范例即 Prompt × 迭代继续法 × 海量文献阅读

①第一个方法论:范例千里淀是前提

AI 的输出质地迷漫取决于输入的范例文档质地。财务核算神态中,咱们千里淀了完整的范例体系行为 Prompt 的中枢输入,包括:

模子假想范例:表定名、时候周期、生命周期、刷新周期;

模范字段英文定名原则:{主体 /fin}{业务场景 / 用度类型}{币种标志}{度量类型}{时候单元};

财务业务全链路假想理念:计费层 → 核算层 → 结算层 → 财务分析层;

业务过程总线矩阵:多个业务过程与多个维度的交叉关系;

数据质地监控范例:完整性、准确性、一致性、合规性、业务章程等多个大类。

②第二个方法论:迭代是常态

不要渴望 AI 一次给出齐备落幕。考据的环节是选拔复杂字段进行抽查 —— 在财务场景中,重心考据触及条件取值的字段(如摊派逻辑、冲销逻辑、多口径方针),对照 SQL 代码考据溯源旅途。每次迭代的产物不单是修正后的输出,更紧要的是范例文档的完善。因此,针对每次迭代的落幕,快速识别要编削的点并修改,这少许就很紧要。也即是说,AI 不错显赫晋升咱们的迭代速率!

③第三个方法论:海量文献阅读

因为超大的 Context,是以不仅不错把历史上已有的文档一次性灌入进去,也不错把原有假想链路的表和代码交给大模子相识,省去大量阅读和相识的时候。同期,巧合帮咱们精确地画出业务架构图,扶直数仓工程师相识业务、构建模子。举例财务数仓架构图,好多子模块的逻辑,都是大模子读取代码后输出想路,再由数仓团队整理酿成的。

3)Prompt 和效果

将以上范例行为学习学问输入给模子,再把原始数据表给到模子,模子即不错产出建模建议。

Prompt 示例:

请读取以下范例文档:

NBA篮球投注app官网下载

数仓范例金钱笃定(含词根字典、定名范例);

离线数仓建造范例白皮书;

团队 Cursor Rules。

分析方针表(输入对应的表名)的建表语句,按照数仓建模范例(ODS → DWD/DIM → DWS → ADM)的式样,输出重构后的建模建议。

第一次生成的效果展示了初步建模建议,在经过继续的调优和学问输入后,最终版块要丰富好多,酿成了完整的财务核算数据 OneData 有盘算推算。

4)收益

经过一段时候的实施,第一版核算数据结构依然落地,效果如下:

效力晋升显赫:百张表的口径溯源、文档输出等模范化使命大幅压缩;

范例遵照率大幅晋升:表定名、字段定名、时候周期等范例严格履行,遵照率较东说念主工有昭着改善;

可复用性强:范例文档、器具剧本、Prompt 模板、使命历程 SOP 均可跨子域复用(已在核算域、技能资本域考据);

数据质地监控体系:基于口径逻辑自动保举 DQC 章程(完整性、准确性、一致性、合规性、业务章程等多大类)。

2、AI SQL Coding 实践(财务 UE 表迭代案例)

1)实践想路

以财务 UE 表某次迭代为代表的案例,主要效力有:

代码结构优化,可读性大幅晋升:方针分段露出、逻辑分层明确,选藏资本昭着责难;

代码建造速率晋升:在范例与口径已对都的前提下,从需求到可上线代码耗时裁汰。

性能优化:举座基线提前完成,为下贱留出更多缓冲时候。

那么,咱们是怎样达成这种效力的?主要靠两点,一是 PRD 快速阅读与相识,二是代码建造效力晋升。

2)怎样相识 SQL Coding 中枢才调

①PRD 阅读与相识方面,AI 巧合帮咱们达成:

快速将 PRD 中的方针、方针、维度、过滤条件索取为结构化要点;对「大促期间」、「小仓卖家」、「冲销」等未精确界说的表述,自动生成待证据问题清单;输出「方针口径」「统计周期」「主键与粒度」等需证据条件。

②代码建造效力晋升方面,AI 巧合帮咱们达成:

基于词根、分层、定名范例与建表模板,生成恰当数仓范例的 DDL 与 SELECT 语句;多维度团聚、归因逻辑、窗口函数、多层嵌套等复杂逻辑,金年会(JinNianHui)体育官网由模子生成第一版 SQL,东说念主工校验微调;对存量长 SQL 进行分段、抽取全球逻辑、协调作风与留意。

3)实践中大模子显赫晋升点

财务 UE 表迭代需求使用 AI 建造后,具体效果如下:

①方针结构分段、编码范例性、留意露出度:

新表:按数仓分层与定名范例生成 DDL 与 SQL,方针按业务域/统计口径分段组织,留意完整(字段含义、口径评释、KEY 符号等),既恰当范例又便于阅读;

旧表变嫌:在保留业务逻辑正确性的前提下,对历史「屎山」代码进行结构化改写——协调别号、补全留意、拆分过宗子查询、显式写出分区过滤等,使后续选藏与排查资本昭着下落;

代码展示对比:编削前 vs 编削后,可从「可读性、范例遵照度、留意澌灭」等维度作念对比分析。

②代码撰写速率大幅度晋升:

AI Coding 的主要圭表:

Step 1:整理需求 → 技能文档 将 BI 需求文档中的字段信息整理进技能文档,明确字段范围;

Step 2:大模子分析字段起首 教导大模子读取 DWD 源码,分析哪些字段已存在、哪些需要新增关联;

Step 3:大模子编写 ETL 代码 由大模子自动在 DWD → DWS → ADM 三层添加字段代码,输出编削代码蚁合;

Step 4:定名范例校准 引入方针字典和 Cursor Rules,让大模子按范例重定名字段(去掉不范例后缀);

Step 5:测试 SQL 生成与跑数考据 大模子生成自测 SQL,渐渐考据各层数据一致性,欠亨逾期追问原因并溯源。

③性能优化及自动调参:

自动识别性能瓶颈:攀附履行谋划、大表扫描、数据歪斜等常见问题,由模子分析 SQL 与表结构,指出潜在慢点;

优化建议生成:在分区编著、谓词下推、JOIN 法例、中间落幕升天等方面给出具体改写建议;

参数调优有盘算推算:针对 Spark/ODPS 等引擎的资源竖立、并行度、歪斜处理参数,给出可落地的调优建议,供运维或建造同学采取。

④基线优化晋升案例:

原链路:多张表串行/并行产出,举座耗时较长;

新链路:经模子扶直作念表同一与逻辑下千里,继续至更少的表,举座耗时昭着裁汰;

优化效果:在保证口径一致的前提下,表数目与初始时候双降,基线提前完成,资源占用与蜕变依赖均得到简化。

3、AI 数据测试(财务 UE 表邮费迭代案例)

1)财务数据测试的相当挑战

在数仓建造使命中,数据测试是保险数据质地的环节环节,但亦然最复杂、最耗时的环节之一。特等是在财务类方针建造中,数据测试濒临着多重挑战:

①测试复杂度高,影响面广:

一个方针的编削不时不是孤苦的,它会激励四百四病,影响其他相干计较方针。在复杂的业务场景中,一个字段的修改可能需要同步考据数十个相干字段的正确性。这种复杂的依赖关系使得东说念主工测试很难作念到全面澌灭,容易出现遗漏。

②业务逻辑复杂,公式考据繁重:

财务方针频繁有明确的数学公式关系:正向 - 冲销 = 冲销之后:需要考据每个字段的正向值、冲销值、冲销之后值之间的计较关系;子项相加 = 汇总项:需要考据各个子项字段相加是否等于汇总字段;

财务的摊派逻辑触及跨周期问题,难以考据:某些业务场景下,订单时候与收入证据时候不匹配,需要进行跨周期摊派,测试逻辑极其复杂。这些公式关系看似简便,但在实践测试中,需要琢磨多样领域情况、精度问题、空值处理等,考据使命量远大。

③测试用例假想繁重:

一个需求不时养殖出大量测试点,单纯凭借个东说念主西宾和才调,很难作念到全面澌灭,容易出现测试盲区,包括:

字段级别的计较逻辑考据;

汇总关系的考据;

冲销逻辑的考据;

领域场景的考据;

精度问题的考据;

业务章程转变的考据。

④业务谈话到数据谈话的转变繁重:

业务东说念主员描摹的需求不时是天然谈话,而数据测试需要将其转变为精确的数据考据逻辑。举例:"退小仓场景下,卖家邮费出资放在第一笔收入冲销,挂在临了一单";"邮费返利抵减技能做事费";"跨周期摊派,贸易化订单时候与交往订单时候不匹配"。

2)AI 在数据测试中的应用实践

那么,咱们怎样通过 AI,来搞定这些复杂问题呢?以某次财务 UE 表邮费迭代神态为例,咱们深度应用 AI 进行数据测试,赢得了显赫效果。

①神态配景:

该神态触及邮费相干字段的全面重构,包括:

迭代字段:修改多个邮费相干字段的计较逻辑;

新增字段:新增浩繁量邮费细分字段;

删除字段:毁掉部分历史字段;

逻辑变更:邮费返利抵减逻辑调理、冲销逻辑优化等。

②AI 应用场景:

a.测试用例自动生成:向 AI 建议测试要求后,AI 巧合自动生成完整的测试 SQL 和评释文档,包括:

正向-冲销=冲销之后的考据逻辑;

子项相加等于汇总项的考据逻辑;

业务章程转变的考据逻辑;

领域场景的考据逻辑。

b.章程相识层面的测试补充:AI 巧合从章程相识层面补充测试案例,如抽样考据、精度考据等,减少因相识不一致带来的质地问题。特等是在复杂的跨周期摊派场景中,AI 巧合识别出东说念主工容易忽略的测试点。

c.复杂逻辑的渐渐分析:针对复杂的业务逻辑,AI 巧合渐渐分析不恰当预期的环节,匡助找到潜在的代码 Bug。举例在邮费冲销逻辑中,AI 巧合分析退小仓场景下的多种分支情况,识别出逻辑罅隙。

d.高下贱影响分析:AI 巧合分析一个字段的编削对高下贱的影响,匡助识别需要同步考据的相干字段,幸免遗漏。

e.公式考据与精度问题会诊:AI 巧合自动生成公式考据 SQL,并识别精度问题。在测试过程中,AI 巧合永诀信得过的逻辑无理和可接受的精度纰谬,幸免误报。

3)实践效果与收益

经过 AI 加合手之后,效果和收益昭着,包括:

①建造效力晋升:

测试 SQL 生收效力昭着晋升:从建议测试要求到生成完整测试 SQL,时候大幅裁汰;测试用例澌灭度晋升:AI 巧合识别出东说念主工容易忽略的测试点,测试澌灭更全面。

②委用质地晋升:

一次委用通过率显赫晋升:从章程相识层面补充测试案例,减少相识不一致带来的质地问题;针对复杂逻辑渐渐分析,找到潜在代码 Bug;自动生周密面的测试用例,减少测试盲区。

③问题发现才调晋升:

AI 在测试过程中巧合:发现东说念主工难以发现的逻辑无理,识别精度问题并永诀可接受的纰谬,分析复杂的业务章程转变问题,会诊高下贱影响关系。

玄虚收益较高。通过 AI 扶直数据测试,举座委用质地大幅晋升,主要体咫尺:测试澌灭更全面,减少遗漏,问题发现更实时,减少返工,测试效力更高,裁汰测试周期,质地保险更可靠,晋升委用信心。

4、AI 需求文档蜕变(财务 UE 表邮费复杂逻辑解读)

1)痛点

相识 PRD 和与业务居品反复查对口径,大致占数仓总体使命时候的较大比例。BI 需求文档不时复杂难解,第一眼看往时看不懂。

2)实践案例:邮费 UE 迭代技能文档

以邮费 UE 迭代需求为例,BI 需求文档触及大量字段口径调理、新增字段、毁掉字段、冲销逻辑重写等复杂内容。举例通过飞书 MCP 让 Cursor 径直读取 BI 需求文档,大模子自动回想出两张表(DWS 层和 ADS 层)各自需要改什么。大模子输出的论断结构露出,按表分类列出:

字段含义/口径调理(哪些字段的逻辑需要改);

数据起首与计较点(应收邮费、实收邮费的新口径);

新增字段清单(应收拆分、冲销相干、实收拆分、资本、UE 等);

毁掉字段清单(相干历史字段);

冲销逻辑重心(退小仓章程);

两表关系与达成法例(先改 DWS 再改 ADS)。

Prompt 实例:读取「邮费逻辑梳理」文档内容,分析其笔墨描摹与财务 UE 表的代码,分析要编削的点,帮我生成对应编削代码和编削原因留意。

通过这个分析落幕,巧合很快地定位要编削的代码,然后一步步相识业务逻辑和具体怎样编削。

3)效果

经过这个过程快速 get 到 PRD 缺失的内容、快速对都,总体交流时候灵验缩减。天然在总时候占比上看似不高,但从简的是工程师最头疼的碎屑化交流时候。

四、回想与瞻望

1、中枢价值

现时商场上,部分头部大厂由于自己居品计谋的原因,扫尾了里面使用最新的大模子和 IDE 器具,导致一线使用大模子的效力受到制约。而咱们则巧合更机动地选拔最恰当的器具组合,在使用技能和西宾鸠合上具备上风。举例,咱们有如下两个方面的上风:

1)才调层面:

范例化章程遵照:注入范例青年景落幕遵照度褂讪保管在高位;

业务抽象才调:快速相识 PRD 中的方针、方针与口径,识别迟滞点;

实践落地案例丰富:财务 UE 表迭代等神态已有可量化落幕。

2)组织与场景层面:

模子选拔机动,不绑定单一厂商,按任务类型采取最优模子;

组织精简高效,从确定地点到试点上露出径露出,试错迭代周期短;

离线数仓分层与范例褂讪,模子易学易用、效果可预期;

离线任务可重跑、可回溯,模子产出便于充分校验后再上线。

2、将来瞻望

使用大模子的才调不单是局限在财务、局限在个东说念主,也要向通盘团队推行,包括:优先选拔 1-2 个痛点明确、范例相对露出的场景作念试点;将灵验的 Prompt 假想、高下文组织式样、测试用例模板等西宾在团队内共享,酿成可复用学问库;从「东说念主作念」为主转向「东说念主定例则与口径、模子履行环节」的合营步地,让大模子成为数仓同学的往常助手。将来已来。

作家丨丹克金年会官网首页入口