项目

一般

简介

行为

CR-010:processed hashjson独立产出变更为内嵌式记录

CR ID:CR-010
标题processed_hash.json 独立产出变更为内嵌式记录
发起人:Henry Lin (PM)
日期:2026-04-17
状态:✅ Approved
影响范围:《0002-Sprint2交付物Checklist.txt》、S2-04 审计规约

1. 变更描述

原文:S2-04 ① 要求“落盘后即刻按年份文件逐个计算 SHA-256,产出 data/metadata/processed_hash.json”。
变更为:不再独立产出 processed_hash.json。各年份 Parquet 文件的 SHA-256 校验值直接作为 sha256 字段,内嵌记录于 data/metadata/data_audit.jsonoutput.parquet_files[*] 数组中。

2. 变更原因(根因追溯)

当前 data_audit.jsonoutput.parquet_files 节点已通过数组结构实现了 filenamerowssha256 的强业务绑定。若额外生成独立的 processed_hash.json,不仅会造成数据冗余,还引入了双文件写入时的原子性与一致性维护成本。内嵌式记录在完全满足防篡改审计诉求的前提下,符合精简产出物的架构原则。

3. 影响分析

受影响模块 影响说明 应对措施
data_audit.json Schema 维持现状不变 无需代码变更
《交付物Checklist》 S2-04 ① 描述需修正 更新为“在 data_audit.jsonoutput.parquet_files 节点中记录各年份文件 SHA-256”

Huarui Lin 更新于 大约 11 小时 之前 · 1 修订