行为
CR-005: MLflow 归档标准化参数语义变更(全局基准化)¶
| 字段 | 内容 |
|---|---|
| CR ID | CR-005 |
| 标题 | MLflow 记录的 standardization_params.parquet 由“局部折参数”变更为“全量重算全局参数” |
| 发起人 | Henry Lin (PM) |
| 日期 | 2026-04-11 |
| 状态 | ✅ Approved |
| 影响范围 | 规约 5.5 节(MLflow 记录)、Step 5 产出物、Step 6 推理服务输入 |
1. 变更描述¶
原隐含语义:跟随 TimeSeriesSplit 某一折的训练集统计量。
变更为:Step 5 在完成 5 折交叉验证后,必须强制触发一次全量数据重算:使用全量原始特征数据(features.parquet),调用 Step 3 暴露的标准化函数,计算出全局最新的截面统计量。该产物作为 standardization_params.parquet 存入 MLflow 并打上 Production 标签。
2. 变更原因(根因追溯)¶
基于 CR-002(方案 B),标准化是逐折独立执行的。推理服务(Step 6)面对的是“本周最新全量截面”数据,如果使用某一折的局部参数进行 Z-Score,会导致标准化结果与当前市场全局特征分布严重偏移(例如局部折中某特征均值为 0.5,而全量最新截面均值为 0.8),直接引发推理结果漂移。
由 Huarui Lin 更新于 5 天 之前 · 1 修订