行为
《四核心字段稳定性承诺函》 ¶
文件编号:DATA-SLA-2026-001
生效日期:2026年04月13日
关联项目:基金量化定投选基系统 (2026-04-11-01)
一、 背景与目的¶
“基金量化定投选基系统”采用全量刷盘重训的流水线架构,对上游数据源的 Schema 具有强依赖。为保障系统在 64GB 严格内存约束下的稳定运行,防止因上游数据结构突变导致的数据血缘断裂或训练管线静默出错,特制定本承诺函。
本函旨在确立数据提供方(上游)与数据消费方(下游研发团队)之间关于核心字段的不可变性契约。
二、 核心字段定义¶
本函所指“四核心字段”,均位于数据表 fund_basic_info 中,具体定义如下:
| 字段名 | 业务含义 | 当前数据类型 | 下游核心用途 |
|---|---|---|---|
fund_id |
基金代码(主键) | String | 跨表 JOIN 的唯一关联键、特征矩阵分组键 |
fund_name |
基金名称 | String | 推理服务最终输出的业务展现标识 |
fund_type |
基金类型(快照值) | String | 白名单过滤(仅保留6类特定基金)的唯一判定依据 |
create_date |
基金成立日期 | Date | 建仓期剔除(硬删前12周)的参考基准 |
三、 不可变性承诺¶
数据提供方在此庄严承诺,在未履行本函第四条“变更管控流程”的情况下,绝对禁止对上述四核心字段执行以下操作:
- 字段更名:严禁修改字段物理列名(包括大小写变更、下划线/驼峰转换)。
-
类型强转:严禁改变字段的数据类型(如将
String强转为Integer,或将Date格式从YYYY-MM-DD变更为时间戳)。 -
隐式废弃:严禁在未通知的情况下将字段置空、填入默认占位符(如
NULL,N/A,unknown)或直接物理删除该列。 - 语义篡改:严禁改变字段的业务含义(如将“基金成立日期”篡改为“数据入库日期”)。
四、 变更管控流程(熔断机制)¶
如因重大业务重构确需对上述四核心字段进行变更,必须严格遵循以下流程:
- 提前 4 周书面通知:数据提供方需至少提前 4 个自然周,向本项目数据资产管理员及项目经理发送正式邮件通知。
-
双写过渡期:变更实施时,必须提供至少 2 周的“双写/双字段”过渡期(例如:新增
fund_type_v2的同时保留原fund_type),支持下游完成数据对齐与管线改造。 - 联合压测:下游研发团队完成适配后,必须在准生产环境下完成至少一次全量刷盘重训的端到端压测,验证无误后方可进行正式切换。
五、 违规影响与免责声明¶
本项目已在数据入库模块(data_loader.py)实施了最高级别的“存在性与类型强校验”防御机制。
若因数据提供方单方面违反本承诺,未按流程变更导致上述字段缺失、类型不匹配或名称变更:
-
系统行为:下游数据清洗管线将在启动阶段直接抛出
ColumnNotFoundError或SchemaValidationError并强制阻断运行。 - 业务影响:当周的全量模型重训将无法启动,推理服务将无法获取最新模型。
- 责任界定:由此导致的模型未更新、业务端推荐停滞等一切后果,其责任由违反本承诺的数据提供方承担,下游研发团队免责。
六、 承诺签署¶
本承诺函一式两份,签署后即产生跨系统协同约束效力,长期有效直至项目下线或签署新的替代契约。
【数据提供方】
授权代表签字:____________________
所属部门/团队:____________________
签署日期:年____月____日
(盖章处)
【数据消费方 / 项目组】
项目经理签字:____________
所属项目组:基金量化定投选基系统
签署日期:2026 年 04 月 13 日
由 Huarui Lin 更新于 4 天 之前 · 2 修订