项目

一般

简介

行为

Story #193

打开

S5-01-时序切分基座与特征标签对齐

Huarui Lin5 天 之前添加. 更新于 5 天 之前.

状态:
New
优先级:
Normal
指派给:
目标版本:
开始日期:
2026-05-18
计划完成日期:
2026-05-19 (截止日期到 32 天)
% 完成:

0%

预期时间:
16:00 小时

描述

读取按年 Parquet,执行 LEFT JOIN 产出未标准化的 train_dataset.parquet,实现 TimeSeriesSplit 索引划分。


① 产出 train_dataset.parquet,Schema 为长表且特征均为原始值;
② 实现严格的 TimeSeriesSplit(n_splits=5) 索引生成器,按时间排序切分,严禁打乱;
③ 单测验证各折的 Train/Val 时间范围无重叠且无未来穿越。


规约 5.1 (训练数据流);规约 5.2 (严禁随机 K-Fold)

Huarui Lin 更新于 5 天 之前

  • 计划完成日期2026-05-11 变更为 2026-05-18
  • 开始日期2026-05-11 变更为 2026-05-18

Huarui Lin 更新于 5 天 之前

  • 计划完成日期2026-05-18 变更为 2026-05-19
  • 预期时间8:00 小时 变更为 16:00 小时
行为

导出 Atom PDF