金年会官网首页入口直击中枢业务! 得物财务数仓Claude AI Coding应用实战

发布日期：2026-05-28 04:14 来源：未知作者：admin 浏览次数：

一、序论：财务数仓为什么需要AI？

二、应用场景概览：从「单点提效」到「全链路增强」

三、中枢应用场景深度领会

四、回想与瞻望

一、序论：财务数仓为什么需要AI？

1、财务数仓的相当性

在电商数仓体系中，财务域是复杂度最高、容错率最低的范围。不仅因为财务对于数据准确性的要求高，也因为财务是横向域，与险些通盘的域都罕有据交叉，因此对业务 Sense 的要求很高。财务数仓工程师实质上在作念三件事：

业务翻译：将交往、支付、资金、促销补贴、资本等数十个业务系统的数据，翻译成通用的财务谈话；

金钱架构：从 ODS 到 DWD、DWS、ADS 层层构建，确保财务 UE、财务管报等公司中枢方针算得准、算得快；

质地兜底：GMV 口径是否协调，退款是否扣减，摊派是否跨周期对都，任何一个字段的偏差都可能导致无理的筹画决策。

财务域的私有挑战在于：字段间存在严格的数学公式关系（正向－冲销＝冲销之后），业务章程触及跨周期摊派，对于质地的要求极高。要是单纯依靠东说念主工兜底，要么容易出错，要么需要冗余大量东说念主力作念复核。尤其是在委用压力大的时候，质地问题就更容易被冷落。

2、痛点聚焦

从财务数仓的相当性登程，咱们不错回想财务数仓的痛点，大体不错分为如下几类：

基本上，在需求连续的每个环节，都可能因为"东说念主"的问题，带来隐患。

3、AI 大模子能带来什么改变

为了灵验搞定"东说念主"的问题，比如催得太急、看不外来、没看仔细、相识无理等问题，咱们引入 AI 来作念改变。中枢想路是：大模子的介入不是替代数仓建造工程师，而是在「需求相识 → 代码编写 → 质地测试 → 文档千里淀」每个环节注入强推理才调。欺诈 AI 来代替东说念主作念大量的重迭性使命，同期减少初级无理概率。

那么为什么 AI 能作念到这少许？从技能发展的趋势看，有三个中枢才调复旧了这一变革：

超大高下文冲突学问孤岛：200k+ token 的高下文窗口，不错将表结构界说、词根字典、方针计较逻辑一次性注入模子的 “使命纪念”，达成基于全域元数据的推演，让大模子具有纪念；

业务语义的自动抽象与对都：大模子能相识 “日活”“留存率”“归因窗口” 等业务术语，并映射为具体 SQL 达成，减少因需求相识偏差导致的返工；Claude 在编码范围显赫优于其他模子，是因为它能 “懂” 业务逻辑，而不是简便的机械履行；

突破东说念主类极限的范例履行力：东说念主工在蹙迫工期下范例遵照率频繁昭着下落，而大模子注入范例后，可褂讪保管在高位。唯有指示给得明确，大模子 “险些” 不会出错。

参考：亚马逊 AWS 对于构建一个强劲、具备自我纠错才调且能查询多种数据源的 Text-to-SQL 搞定有盘算推算架构图。

二、应用场景概览：从「单点提效」到「全链路增强」

1、场景与提效预期

基于上述不雅点，在财务范围，大模子不错在哪些具体的环节落地呢？以下是字据笔者近期实践西宾，列出的可落地场景及提效预期。

2、东说念主机合营步地：数仓研发的「L3 时刻」

要是借用自动驾驶的分级模范，现时数仓大模子应用正处于从 L2（扶直驾驶）向 L3（有条件自动驾驶）过渡的阶段，即在明确的 Prompt 管理与范例文档复旧下，AI 能继承绝大部分模范化的履行径作。

在财务域的实践中，咱们亦然按照这套自动驾驶分级的方法，将往常使命拆解成了三级：

这种单干背后的逻辑是：范例履行是东说念主类的短板、AI 的长板；业务判断是 AI 的短板、东说念主类的长板。东说念主工在蹙迫工期下对定名范例、分区管理、留意要求的遵照率频繁昭着下落，且容易因疲困产生遗漏；而 AI 一朝"学会"了团队范例，输出的范例遵照度可褂讪保管在较高水平。反过来，AI 无法替代的是那些需要相识业务高下文、衡量弃取、处理不合的使命。

3、AI 对于数仓全链路研发的提效作用

学习 Andrej Karpathy 对于 ChatGPT 共享的内容时，最大的感受是：AI 最强的才调，是 "泛化"。因此，要是咱们不错把数仓研发的链路拆分明晰，那么 AI 例必巧合对其中的每一个环节提效，最终带来研发效力的大幅度晋升！

三、中枢应用场景深度领会

1、AI OneData 模范化建模（财务核算数据神态）

1）配景：财务核算 OneData 为什么难搞？

因为：仅第一轮模子假想，就触及百张以上的表、多个子域、十余个业务过程、数百个方针。要是琢磨到后续的二次/三次迭代，使命量例必大到无法想象。在现时以委用为主的阶段，很难破耗如斯多的时候作念基建。以某次核算神态为例，各层表数目散播如下：

同期，财务域的中枢特征是起首多（全公司系统）、方针多（单表字段数稠密），但以可累加方针为主。财务严格道理上莫得原子方针，全是基于业务方针加工出来的派生方针，且一个财务方针不时有多种口径：业务口径、资金口径、财管报口径。况且，神态触及多个子域（核算域、技能资本域、促销补贴域、贸易化域、分析域），澌灭从「计费 → 核算 → 结算 → 财务分析」的端到端业务过程体系。要是要透顶相识核算 OneData 的构建，不仅要懂数仓，还要懂财务，还要纯属公司财务系统，这个要求特等难作念到！主要难点荟萃在四个方面：

①口径溯源极其复杂：大量逻辑在工程侧达成，绝大多数表缺休闲务文档、技能文档、口径文档，口径逻辑需要基于代码计算，存在无理可能性，溯源使命量远大。

②范例履行不一致：财务域触及表定名范例（DIM/DWD/DWS/ADM 各有时势要求）、时候周期范例（1d/7d/30d/wtd/mtd/ytd 等多种）、生命周期范例、刷新周期范例、模范字段英文定名原则（{主体}{业务场景}{币种标志}{度量类型}{时候单元}）。范例越细，东说念主工遵照率越低。

③跨域依赖复杂：财务是横向域，与各业务域交叉。核算域依赖大量上游表，技能资本域需要从云做事、算法、产研东说念主力、标注东说念主力等多个起首接入数据。

④文档输出繁琐：每个 ADM 表都必须包含 OnePage 文档（OneData 有盘算推算最紧要内容），加上口径文档、模子使用评释、下贱 mapping 文档，文档间大量重迭但需各写一遍。

是以，咱们更需要通过 AI 的才调，来作念一套新期间的建模方法论，以顺应 “低进入、大假想” 的智能建模场景。

2）建模方法论：范例即 Prompt × 迭代继续法 × 海量文献阅读

①第一个方法论：范例千里淀是前提

AI 的输出质地迷漫取决于输入的范例文档质地。财务核算神态中，咱们千里淀了完整的范例体系行为 Prompt 的中枢输入，包括：

模子假想范例：表定名、时候周期、生命周期、刷新周期；

模范字段英文定名原则：{主体 /fin}{业务场景 / 用度类型}{币种标志}{度量类型}{时候单元}；

财务业务全链路假想理念：计费层 → 核算层 → 结算层 → 财务分析层；

业务过程总线矩阵：多个业务过程与多个维度的交叉关系；

数据质地监控范例：完整性、准确性、一致性、合规性、业务章程等多个大类。

②第二个方法论：迭代是常态

不要渴望 AI 一次给出齐备落幕。考据的环节是选拔复杂字段进行抽查 —— 在财务场景中，重心考据触及条件取值的字段（如摊派逻辑、冲销逻辑、多口径方针），对照 SQL 代码考据溯源旅途。每次迭代的产物不单是修正后的输出，更紧要的是范例文档的完善。因此，针对每次迭代的落幕，快速识别要编削的点并修改，这少许就很紧要。也即是说，AI 不错显赫晋升咱们的迭代速率！

③第三个方法论：海量文献阅读

因为超大的 Context，是以不仅不错把历史上已有的文档一次性灌入进去，也不错把原有假想链路的表和代码交给大模子相识，省去大量阅读和相识的时候。同期，巧合帮咱们精确地画出业务架构图，扶直数仓工程师相识业务、构建模子。举例财务数仓架构图，好多子模块的逻辑，都是大模子读取代码后输出想路，再由数仓团队整理酿成的。

3）Prompt 和效果

将以上范例行为学习学问输入给模子，再把原始数据表给到模子，模子即不错产出建模建议。

Prompt 示例：

请读取以下范例文档：

NBA篮球投注app官网下载

数仓范例金钱笃定（含词根字典、定名范例）；

离线数仓建造范例白皮书；

团队 Cursor Rules。

分析方针表（输入对应的表名）的建表语句，按照数仓建模范例（ODS → DWD/DIM → DWS → ADM）的式样，输出重构后的建模建议。

第一次生成的效果展示了初步建模建议，在经过继续的调优和学问输入后，最终版块要丰富好多，酿成了完整的财务核算数据 OneData 有盘算推算。

4）收益

经过一段时候的实施，第一版核算数据结构依然落地，效果如下：

效力晋升显赫：百张表的口径溯源、文档输出等模范化使命大幅压缩；

范例遵照率大幅晋升：表定名、字段定名、时候周期等范例严格履行，遵照率较东说念主工有昭着改善；

可复用性强：范例文档、器具剧本、Prompt 模板、使命历程 SOP 均可跨子域复用（已在核算域、技能资本域考据）；

数据质地监控体系：基于口径逻辑自动保举 DQC 章程（完整性、准确性、一致性、合规性、业务章程等多大类）。

2、AI SQL Coding 实践（财务 UE 表迭代案例）

1）实践想路

以财务 UE 表某次迭代为代表的案例，主要效力有：

代码结构优化，可读性大幅晋升：方针分段露出、逻辑分层明确，选藏资本昭着责难；

代码建造速率晋升：在范例与口径已对都的前提下，从需求到可上线代码耗时裁汰。

性能优化：举座基线提前完成，为下贱留出更多缓冲时候。

那么，咱们是怎样达成这种效力的？主要靠两点，一是 PRD 快速阅读与相识，二是代码建造效力晋升。

2）怎样相识 SQL Coding 中枢才调

①PRD 阅读与相识方面，AI 巧合帮咱们达成：

快速将 PRD 中的方针、方针、维度、过滤条件索取为结构化要点；对「大促期间」、「小仓卖家」、「冲销」等未精确界说的表述，自动生成待证据问题清单；输出「方针口径」「统计周期」「主键与粒度」等需证据条件。

②代码建造效力晋升方面，AI 巧合帮咱们达成：

基于词根、分层、定名范例与建表模板，生成恰当数仓范例的 DDL 与 SELECT 语句；多维度团聚、归因逻辑、窗口函数、多层嵌套等复杂逻辑，金年会(JinNianHui)体育官网由模子生成第一版 SQL，东说念主工校验微调；对存量长 SQL 进行分段、抽取全球逻辑、协调作风与留意。

3）实践中大模子显赫晋升点

财务 UE 表迭代需求使用 AI 建造后，具体效果如下：

①方针结构分段、编码范例性、留意露出度：

新表：按数仓分层与定名范例生成 DDL 与 SQL，方针按业务域/统计口径分段组织，留意完整（字段含义、口径评释、KEY 符号等），既恰当范例又便于阅读；

旧表变嫌：在保留业务逻辑正确性的前提下，对历史「屎山」代码进行结构化改写——协调别号、补全留意、拆分过宗子查询、显式写出分区过滤等，使后续选藏与排查资本昭着下落；

代码展示对比：编削前 vs 编削后，可从「可读性、范例遵照度、留意澌灭」等维度作念对比分析。

②代码撰写速率大幅度晋升：

AI Coding 的主要圭表：

Step 1：整理需求 → 技能文档将 BI 需求文档中的字段信息整理进技能文档，明确字段范围；

Step 2：大模子分析字段起首教导大模子读取 DWD 源码，分析哪些字段已存在、哪些需要新增关联；

Step 3：大模子编写 ETL 代码由大模子自动在 DWD → DWS → ADM 三层添加字段代码，输出编削代码蚁合；

Step 4：定名范例校准引入方针字典和 Cursor Rules，让大模子按范例重定名字段（去掉不范例后缀）；

Step 5：测试 SQL 生成与跑数考据大模子生成自测 SQL，渐渐考据各层数据一致性，欠亨逾期追问原因并溯源。

③性能优化及自动调参：

自动识别性能瓶颈：攀附履行谋划、大表扫描、数据歪斜等常见问题，由模子分析 SQL 与表结构，指出潜在慢点；

优化建议生成：在分区编著、谓词下推、JOIN 法例、中间落幕升天等方面给出具体改写建议；

参数调优有盘算推算：针对 Spark/ODPS 等引擎的资源竖立、并行度、歪斜处理参数，给出可落地的调优建议，供运维或建造同学采取。

④基线优化晋升案例：

原链路：多张表串行/并行产出，举座耗时较长；

新链路：经模子扶直作念表同一与逻辑下千里，继续至更少的表，举座耗时昭着裁汰；

优化效果：在保证口径一致的前提下，表数目与初始时候双降，基线提前完成，资源占用与蜕变依赖均得到简化。

3、AI 数据测试（财务 UE 表邮费迭代案例）

1）财务数据测试的相当挑战

在数仓建造使命中，数据测试是保险数据质地的环节环节，但亦然最复杂、最耗时的环节之一。特等是在财务类方针建造中，数据测试濒临着多重挑战：

①测试复杂度高，影响面广：

一个方针的编削不时不是孤苦的，它会激励四百四病，影响其他相干计较方针。在复杂的业务场景中，一个字段的修改可能需要同步考据数十个相干字段的正确性。这种复杂的依赖关系使得东说念主工测试很难作念到全面澌灭，容易出现遗漏。

②业务逻辑复杂，公式考据繁重：

财务方针频繁有明确的数学公式关系：正向 - 冲销 = 冲销之后：需要考据每个字段的正向值、冲销值、冲销之后值之间的计较关系；子项相加 = 汇总项：需要考据各个子项字段相加是否等于汇总字段；

财务的摊派逻辑触及跨周期问题，难以考据：某些业务场景下，订单时候与收入证据时候不匹配，需要进行跨周期摊派，测试逻辑极其复杂。这些公式关系看似简便，但在实践测试中，需要琢磨多样领域情况、精度问题、空值处理等，考据使命量远大。

③测试用例假想繁重：

一个需求不时养殖出大量测试点，单纯凭借个东说念主西宾和才调，很难作念到全面澌灭，容易出现测试盲区，包括：

字段级别的计较逻辑考据；

汇总关系的考据；

冲销逻辑的考据；

领域场景的考据；

精度问题的考据；

业务章程转变的考据。

④业务谈话到数据谈话的转变繁重：

业务东说念主员描摹的需求不时是天然谈话，而数据测试需要将其转变为精确的数据考据逻辑。举例："退小仓场景下，卖家邮费出资放在第一笔收入冲销，挂在临了一单"；"邮费返利抵减技能做事费"；"跨周期摊派，贸易化订单时候与交往订单时候不匹配"。

2）AI 在数据测试中的应用实践

那么，咱们怎样通过 AI，来搞定这些复杂问题呢？以某次财务 UE 表邮费迭代神态为例，咱们深度应用 AI 进行数据测试，赢得了显赫效果。

①神态配景：

该神态触及邮费相干字段的全面重构，包括：

迭代字段：修改多个邮费相干字段的计较逻辑；

新增字段：新增浩繁量邮费细分字段；

删除字段：毁掉部分历史字段；

逻辑变更：邮费返利抵减逻辑调理、冲销逻辑优化等。

②AI 应用场景：

a.测试用例自动生成：向 AI 建议测试要求后，AI 巧合自动生成完整的测试 SQL 和评释文档，包括：

正向-冲销=冲销之后的考据逻辑；

子项相加等于汇总项的考据逻辑；

业务章程转变的考据逻辑；

领域场景的考据逻辑。

b.章程相识层面的测试补充：AI 巧合从章程相识层面补充测试案例，如抽样考据、精度考据等，减少因相识不一致带来的质地问题。特等是在复杂的跨周期摊派场景中，AI 巧合识别出东说念主工容易忽略的测试点。

c.复杂逻辑的渐渐分析：针对复杂的业务逻辑，AI 巧合渐渐分析不恰当预期的环节，匡助找到潜在的代码 Bug。举例在邮费冲销逻辑中，AI 巧合分析退小仓场景下的多种分支情况，识别出逻辑罅隙。

d.高下贱影响分析：AI 巧合分析一个字段的编削对高下贱的影响，匡助识别需要同步考据的相干字段，幸免遗漏。

e.公式考据与精度问题会诊：AI 巧合自动生成公式考据 SQL，并识别精度问题。在测试过程中，AI 巧合永诀信得过的逻辑无理和可接受的精度纰谬，幸免误报。

3）实践效果与收益

经过 AI 加合手之后，效果和收益昭着，包括：

①建造效力晋升：

测试 SQL 生收效力昭着晋升：从建议测试要求到生成完整测试 SQL，时候大幅裁汰；测试用例澌灭度晋升：AI 巧合识别出东说念主工容易忽略的测试点，测试澌灭更全面。

②委用质地晋升：

一次委用通过率显赫晋升：从章程相识层面补充测试案例，减少相识不一致带来的质地问题；针对复杂逻辑渐渐分析，找到潜在代码 Bug；自动生周密面的测试用例，减少测试盲区。

③问题发现才调晋升：

AI 在测试过程中巧合：发现东说念主工难以发现的逻辑无理，识别精度问题并永诀可接受的纰谬，分析复杂的业务章程转变问题，会诊高下贱影响关系。

玄虚收益较高。通过 AI 扶直数据测试，举座委用质地大幅晋升，主要体咫尺：测试澌灭更全面，减少遗漏，问题发现更实时，减少返工，测试效力更高，裁汰测试周期，质地保险更可靠，晋升委用信心。

4、AI 需求文档蜕变（财务 UE 表邮费复杂逻辑解读）

1）痛点

相识 PRD 和与业务居品反复查对口径，大致占数仓总体使命时候的较大比例。BI 需求文档不时复杂难解，第一眼看往时看不懂。

2）实践案例：邮费 UE 迭代技能文档

以邮费 UE 迭代需求为例，BI 需求文档触及大量字段口径调理、新增字段、毁掉字段、冲销逻辑重写等复杂内容。举例通过飞书 MCP 让 Cursor 径直读取 BI 需求文档，大模子自动回想出两张表（DWS 层和 ADS 层）各自需要改什么。大模子输出的论断结构露出，按表分类列出：

字段含义/口径调理（哪些字段的逻辑需要改）；

数据起首与计较点（应收邮费、实收邮费的新口径）；

新增字段清单（应收拆分、冲销相干、实收拆分、资本、UE 等）；

毁掉字段清单（相干历史字段）；

冲销逻辑重心（退小仓章程）；

两表关系与达成法例（先改 DWS 再改 ADS）。

Prompt 实例：读取「邮费逻辑梳理」文档内容，分析其笔墨描摹与财务 UE 表的代码，分析要编削的点，帮我生成对应编削代码和编削原因留意。

通过这个分析落幕，巧合很快地定位要编削的代码，然后一步步相识业务逻辑和具体怎样编削。

3）效果

经过这个过程快速 get 到 PRD 缺失的内容、快速对都，总体交流时候灵验缩减。天然在总时候占比上看似不高，但从简的是工程师最头疼的碎屑化交流时候。

四、回想与瞻望

1、中枢价值

现时商场上，部分头部大厂由于自己居品计谋的原因，扫尾了里面使用最新的大模子和 IDE 器具，导致一线使用大模子的效力受到制约。而咱们则巧合更机动地选拔最恰当的器具组合，在使用技能和西宾鸠合上具备上风。举例，咱们有如下两个方面的上风：

1）才调层面：

范例化章程遵照：注入范例青年景落幕遵照度褂讪保管在高位；

业务抽象才调：快速相识 PRD 中的方针、方针与口径，识别迟滞点；

实践落地案例丰富：财务 UE 表迭代等神态已有可量化落幕。

2）组织与场景层面：

模子选拔机动，不绑定单一厂商，按任务类型采取最优模子；

组织精简高效，从确定地点到试点上露出径露出，试错迭代周期短；

离线数仓分层与范例褂讪，模子易学易用、效果可预期；

离线任务可重跑、可回溯，模子产出便于充分校验后再上线。

2、将来瞻望

使用大模子的才调不单是局限在财务、局限在个东说念主，也要向通盘团队推行，包括：优先选拔 1-2 个痛点明确、范例相对露出的场景作念试点；将灵验的 Prompt 假想、高下文组织式样、测试用例模板等西宾在团队内共享，酿成可复用学问库；从「东说念主作念」为主转向「东说念主定例则与口径、模子履行环节」的合营步地，让大模子成为数仓同学的往常助手。将来已来。

作家丨丹克金年会官网首页入口

上一篇：上一篇：金年会官网首页入口市集监管总局批准长安汽车与江铃集团收购江铃控股

下一篇：下一篇：金年会官网首页入口小米集团：握行200亿港元股份购回计算

关于JNH

金年会官网首页入口 直击中枢业务! 得物财务数仓Claude AI Coding应用实战

金年会官网首页入口直击中枢业务! 得物财务数仓Claude AI Coding应用实战