行为
Story #192
打开S3-04-特征落盘、血缘与双轨制文档
开始日期:
2026-05-08
计划完成日期:
2026-05-08 (截止日期到 21 天)
% 完成:
0%
预期时间:
8:00 小时
描述
按年分区写长表特征 Parquet,更新 Hash 与数据契约文档。
① data/features/features_YYYY.parquet 产出,Schema 为长表:fund_id, net_value_date, segment_id, feature_1, ..., feature_K;
② PyArrow 写入指定 row_group_size=100000;
③ 产出 data/metadata/features_hash.json;
④ docs/data_contract.md 同步更新特征字典(含 _w 命名示例)。
规约 7.4 (严禁Pivot宽表);FW-4 (按年覆盖写回);架构基线 3
没有任何数据可供显示
行为