0002-四核心字段稳定性承诺函 » 历史记录 » 版本 1
Huarui Lin, 2026-04-13 13:44
| 1 | 1 | Huarui Lin | # 数据源接口契约:《四核心字段稳定性承诺函》 |
|---|---|---|---|
| 2 | |||
| 3 | **文件编号**:DATA-SLA-2026-001 |
||
| 4 | **生效日期**:2026年04月13日 |
||
| 5 | **关联项目**:基金量化定投选基系统 (2026-04-11-01) |
||
| 6 | |||
| 7 | --- |
||
| 8 | ### 一、 背景与目的 |
||
| 9 | |||
| 10 | “基金量化定投选基系统”采用全量刷盘重训的流水线架构,对上游数据源的 Schema 具有强依赖。为保障系统在 64GB 严格内存约束下的稳定运行,防止因上游数据结构突变导致的数据血缘断裂或训练管线静默出错,特制定本承诺函。 |
||
| 11 | 本函旨在确立数据提供方(上游)与数据消费方(下游研发团队)之间关于核心字段的不可变性契约。 |
||
| 12 | |||
| 13 | --- |
||
| 14 | ### 二、 核心字段定义 |
||
| 15 | |||
| 16 | 本函所指“四核心字段”,均位于数据表 `fund_basic_info` 中,具体定义如下: |
||
| 17 | | 字段名 | 业务含义 | 当前数据类型 | 下游核心用途 | |
||
| 18 | | :--- | :--- | :--- | :--- | |
||
| 19 | | `fund_id` | 基金代码(主键) | String | 跨表 JOIN 的唯一关联键、特征矩阵分组键 | |
||
| 20 | | `fund_name` | 基金名称 | String | 推理服务最终输出的业务展现标识 | |
||
| 21 | | `fund_type` | 基金类型(快照值) | String | 白名单过滤(仅保留6类特定基金)的唯一判定依据 | |
||
| 22 | | `create_date` | 基金成立日期 | Date | 建仓期剔除(硬删前12周)的参考基准 | |
||
| 23 | |||
| 24 | --- |
||
| 25 | ### 三、 不可变性承诺 |
||
| 26 | |||
| 27 | 数据提供方在此庄严承诺,在未履行本函第四条“变更管控流程”的情况下,**绝对禁止**对上述四核心字段执行以下操作: |
||
| 28 | 1. **字段更名**:严禁修改字段物理列名(包括大小写变更、下划线/驼峰转换)。 |
||
| 29 | 2. **类型强转**:严禁改变字段的数据类型(如将 `String` 强转为 `Integer`,或将 `Date` 格式从 `YYYY-MM-DD` 变更为时间戳)。 |
||
| 30 | 3. **隐式废弃**:严禁在未通知的情况下将字段置空、填入默认占位符(如 `NULL`, `N/A`, `unknown`)或直接物理删除该列。 |
||
| 31 | 4. **语义篡改**:严禁改变字段的业务含义(如将“基金成立日期”篡改为“数据入库日期”)。 |
||
| 32 | |||
| 33 | --- |
||
| 34 | ### 四、 变更管控流程(熔断机制) |
||
| 35 | |||
| 36 | 如因重大业务重构确需对上述四核心字段进行变更,**必须**严格遵循以下流程: |
||
| 37 | 1. **提前 4 周书面通知**:数据提供方需至少提前 4 个自然周,向本项目数据资产管理员及项目经理发送正式邮件通知。 |
||
| 38 | 2. **双写过渡期**:变更实施时,必须提供至少 2 周的“双写/双字段”过渡期(例如:新增 `fund_type_v2` 的同时保留原 `fund_type`),支持下游完成数据对齐与管线改造。 |
||
| 39 | 3. **联合压测**:下游研发团队完成适配后,必须在准生产环境下完成至少一次全量刷盘重训的端到端压测,验证无误后方可进行正式切换。 |
||
| 40 | |||
| 41 | --- |
||
| 42 | ### 五、 违规影响与免责声明 |
||
| 43 | |||
| 44 | 本项目已在数据入库模块(`data_loader.py`)实施了最高级别的“存在性与类型强校验”防御机制。 |
||
| 45 | 若因数据提供方单方面违反本承诺,未按流程变更导致上述字段缺失、类型不匹配或名称变更: |
||
| 46 | - **系统行为**:下游数据清洗管线将在启动阶段直接抛出 `ColumnNotFoundError` 或 `SchemaValidationError` 并**强制阻断运行**。 |
||
| 47 | - **业务影响**:当周的全量模型重训将无法启动,推理服务将无法获取最新模型。 |
||
| 48 | - **责任界定**:由此导致的模型未更新、业务端推荐停滞等一切后果,其责任由违反本承诺的数据提供方承担,下游研发团队免责。 |
||
| 49 | |||
| 50 | --- |
||
| 51 | ### 六、 承诺签署 |
||
| 52 | |||
| 53 | 本承诺函一式两份,签署后即产生跨系统协同约束效力,长期有效直至项目下线或签署新的替代契约。 |
||
| 54 | **【数据提供方】** |
||
| 55 | 授权代表签字:____________________ |
||
| 56 | 所属部门/团队:____________________ |
||
| 57 | 签署日期:________年____月____日 |
||
| 58 | (盖章处) |
||
| 59 | **【数据消费方 / 项目组】** |
||
| 60 | 项目经理签字:____________________ |
||
| 61 | 所属项目组:基金量化定投选基系统 |
||
| 62 | 签署日期:2026 年 04 月 13 日 |