项目

一般

简介

行为

CR-005: MLflow 归档标准化参数语义变更(全局基准化)

字段 内容
CR ID CR-005
标题 MLflow 记录的 standardization_params.parquet 由“局部折参数”变更为“全量重算全局参数”
发起人 Henry Lin (PM)
日期 2026-04-11
状态 ✅ Approved
影响范围 规约 5.5 节(MLflow 记录)、Step 5 产出物、Step 6 推理服务输入

1. 变更描述

原隐含语义:跟随 TimeSeriesSplit 某一折的训练集统计量。
变更为:Step 5 在完成 5 折交叉验证后,必须强制触发一次全量数据重算:使用全量原始特征数据(features.parquet),调用 Step 3 暴露的标准化函数,计算出全局最新的截面统计量。该产物作为 standardization_params.parquet 存入 MLflow 并打上 Production 标签。

2. 变更原因(根因追溯)

基于 CR-002(方案 B),标准化是逐折独立执行的。推理服务(Step 6)面对的是“本周最新全量截面”数据,如果使用某一折的局部参数进行 Z-Score,会导致标准化结果与当前市场全局特征分布严重偏移(例如局部折中某特征均值为 0.5,而全量最新截面均值为 0.8),直接引发推理结果漂移。


Huarui Lin 更新于 5 天 之前 · 1 修订