项目

一般

简介

Story #185

Huarui Lin 更新于 2 天 之前

**接收全量 Arrow,实现 ffill、>4周缺失截断并打 segment_id、建仓期硬删、异常值处理。** 

 --- 
 ① segment_id 截断处严格递增,同基金内从 截断处递增,同基金内从 0 开始; 
 ② 建仓期(12周)剔除严格锚定且仅作用于 建仓期硬删取 segment_id == 0,即使 segment_0 被完全物理抹除,后续段仍予保留; 0 首条日期减 12 周(非全局首条); 
 ③ cumulative_net_value ≤ 0 的行被剔除; 的行被剔除(不进入 Parquet);异常值(单周涨跌幅绝对值 >50%)置 NULL,判定基准必须基于“本周原始有值且上周原始有值”的真实相邻周,ffill 填充值不参与判定; 单周涨跌幅 >50% 的行 cumulative_net_value 置 NULL(保留行,保留时间连续性);单测强卡控:必须覆盖“segment_0 被建仓期完全吞噬后 segment_1 仍保留”及“长缺失 ffill 恢复首周免于 >50% 误杀”场景。 单测必覆盖:跨年 ffill、刚好第 5 周缺失触发截断、单基金仅 10 周被建仓期完全剔除、异常值 NULL 化。 

 --- 
 *规约 1.2 (缺失填充/截断/建仓期/异常值);CR-001 (segment_id);全量 Arrow 破局方案* 

返回