项目

一般

简介

行为

《四核心字段稳定性承诺函》

文件编号:DATA-SLA-2026-001
生效日期:2026年04月13日
关联项目:基金量化定投选基系统 (2026-04-11-01)


一、 背景与目的

“基金量化定投选基系统”采用全量刷盘重训的流水线架构,对上游数据源的 Schema 具有强依赖。为保障系统在 64GB 严格内存约束下的稳定运行,防止因上游数据结构突变导致的数据血缘断裂或训练管线静默出错,特制定本承诺函。
本函旨在确立数据提供方(上游)与数据消费方(下游研发团队)之间关于核心字段的不可变性契约。


二、 核心字段定义

本函所指“四核心字段”,均位于数据表 fund_basic_info 中,具体定义如下:

字段名 业务含义 当前数据类型 下游核心用途
fund_id 基金代码(主键) String 跨表 JOIN 的唯一关联键、特征矩阵分组键
fund_name 基金名称 String 推理服务最终输出的业务展现标识
fund_type 基金类型(快照值) String 白名单过滤(仅保留6类特定基金)的唯一判定依据
create_date 基金成立日期 Date 建仓期剔除(硬删前12周)的参考基准

三、 不可变性承诺

数据提供方在此庄严承诺,在未履行本函第四条“变更管控流程”的情况下,绝对禁止对上述四核心字段执行以下操作:

  1. 字段更名:严禁修改字段物理列名(包括大小写变更、下划线/驼峰转换)。
  2. 类型强转:严禁改变字段的数据类型(如将 String 强转为 Integer,或将 Date 格式从 YYYY-MM-DD 变更为时间戳)。
  3. 隐式废弃:严禁在未通知的情况下将字段置空、填入默认占位符(如 NULL, N/A, unknown)或直接物理删除该列。
  4. 语义篡改:严禁改变字段的业务含义(如将“基金成立日期”篡改为“数据入库日期”)。

四、 变更管控流程(熔断机制)

如因重大业务重构确需对上述四核心字段进行变更,必须严格遵循以下流程:

  1. 提前 4 周书面通知:数据提供方需至少提前 4 个自然周,向本项目数据资产管理员及项目经理发送正式邮件通知。
  2. 双写过渡期:变更实施时,必须提供至少 2 周的“双写/双字段”过渡期(例如:新增 fund_type_v2 的同时保留原 fund_type),支持下游完成数据对齐与管线改造。
  3. 联合压测:下游研发团队完成适配后,必须在准生产环境下完成至少一次全量刷盘重训的端到端压测,验证无误后方可进行正式切换。

五、 违规影响与免责声明

本项目已在数据入库模块(data_loader.py)实施了最高级别的“存在性与类型强校验”防御机制。
若因数据提供方单方面违反本承诺,未按流程变更导致上述字段缺失、类型不匹配或名称变更:

  • 系统行为:下游数据清洗管线将在启动阶段直接抛出 ColumnNotFoundErrorSchemaValidationError强制阻断运行
  • 业务影响:当周的全量模型重训将无法启动,推理服务将无法获取最新模型。
  • 责任界定:由此导致的模型未更新、业务端推荐停滞等一切后果,其责任由违反本承诺的数据提供方承担,下游研发团队免责。

六、 承诺签署

本承诺函一式两份,签署后即产生跨系统协同约束效力,长期有效直至项目下线或签署新的替代契约。
【数据提供方】
授权代表签字:____________________
所属部门/团队:____________________
签署日期:年____月____日
(盖章处)
【数据消费方 / 项目组】
项目经理签字:
____________
所属项目组:基金量化定投选基系统
签署日期:2026 年 04 月 13 日

Huarui Lin 更新于 4 天 之前 · 2 修订