尘土与星辰 -1992|第196章|哈希与复诊|中文
屏幕的冷光打在键盘上,映出指尖的轮廓。林尘新建了一个Python脚本,命名为`desensitization_v1.py`。他调出`hashlib`库,导入SHA-256算法。用户隐私字段脱敏,核心不是加密,而是不可逆的哈希映射。运营侧需要保留字段间的关联逻辑
第196章 哈希与复诊
屏幕的冷光打在键盘上,映出指尖的轮廓。林尘新建了一个Python脚本,命名为desensitization_v1.py。他调出hashlib库,导入SHA-256算法。用户隐私字段脱敏,核心不是加密,而是不可逆的哈希映射。运营侧需要保留字段间的关联逻辑来跑转化率漏斗,这意味着他必须在“彻底抹除原始信息”和“维持数据可追溯性”之间找到平衡点。
他先写了一个加盐函数。盐值取自项目内部的环境变量,避免硬编码泄露。接着是数据读取模块。老陈给的是CSV格式,但实际跑起来会发现,部分手机号字段混入了空格、横杠,甚至全角字符。他加了正则清洗层,re.sub(r'[^\d]', '', phone),剥离非数字,再统一补全11位。遇到空值或异常长度,直接标记为UNKNOWN,不抛异常中断流程。这是外包时期踩过的坑,现在必须写进底层逻辑里。
左脚脚踝的肿胀已经蔓延到小腿肚。绷带勒得太紧,血液循环受阻,皮肤泛起一层细密的冷汗。他停下敲击,把脚从矮凳上挪下来,踩在冰凉的地砖上。刺痛顺着神经往上窜,他咬紧后槽牙,等那股锐痛过去,才重新坐回椅子。椅子腿摩擦地面,发出轻微的声响。他立刻停住,侧耳听卧室的动静。呼吸声平稳,父母睡熟了。
凌晨两点。卧室里传来轻微的咳嗽声。是母亲。林尘起身,倒了半杯温水,轻轻推开门。王桂英半靠在床头,呼吸有些浊。林建国坐在床沿的塑料凳上,背对着门,肩膀微微佝偻。听见动静,他转过头,没说话,只是接过水杯,递到妻子嘴边。
“妈,喝点水。”林尘声音压得很低。 王桂英抿了一口,摆摆手。“没事,老毛病。你忙你的,别管我们。” 林尘没接话,把被子往上拉了拉,掖好被角。退出来时,他看了一眼父亲。林建国的手里捏着一张皱巴巴的纸巾,指节泛白。那是下午在医院走廊里,林尘去拿报告时,父亲独自等在外面留下的。林尘知道,父亲在算账。干农活、卖粮食、借债、还债。这些数字刻在老农的骨头里,比任何Excel表格都精确。他们不习惯表达担忧,只习惯把焦虑折算成具体的开支,然后默默扛着。
回到客厅。屏幕上的进度条走到78%。他继续写日志模块。每次处理一万条数据,写入一行INFO记录;遇到清洗失败的脏数据,写入ERROR并附带原始行号。这是给安全合规部看的凭证,也是给自己留的退路。代码不需要华丽,只需要稳定。他习惯把复杂问题拆成可执行的步骤,一步一校验,不留模糊地带。
四点二十。脚本跑完最后一批测试数据。终端输出:Processed: 850,000 rows. Hashed: 849,992. Skipped: 8. Time: 14m 32s. 成功率99.99%。他打开Word,将脱敏逻辑、字段映射表、异常处理流程图逐一粘贴。排版,检查错别字,导出PDF。文件名:“数据脱敏方案_V1_终稿.pdf”。
七点五十。他点击发送。收件人:安全合规部、老陈、李总监。抄送:自己。 邮件发出去的瞬间,他靠在椅背上,长长地吐出一口气。窗外的天色已经泛白,灰蓝色的晨光渗进百叶窗。他起身,去厨房熬了一锅小米粥,煎了两个荷包蛋。热粥的香气弥漫在狭小的出租屋里,盖过了消毒水和旧家具的味道。
七点四十。他叫醒父母。“妈,今天去复诊。我请了假。” 王桂英坐起来,揉了揉膝盖。“不用去,医生昨天不是说了吗,开点药就行。城里看病贵,来回打车又费钱。” “肌电图报告要医生当面看。”林尘语气平静,没有商量余地,“车我已经叫好了。吃完早饭就走。” 林建国默默穿上外套,把编织袋里的干菜重新整理好,放在厨房台面上。“我们早点回,不耽误你上班。”
八点二十。市三院神经内科。副主任医师姓周,戴着眼镜,翻看着打印出来的肌电图报告。
“神经传导速度减慢,波幅降低。”周医生指着屏幕上的曲线,“典型的周围神经病变。常年重体力劳动,加上年龄,神经髓鞘有损伤。不是急症,但得养。”他开了处方:甲钴胺片、维生素B1、加巴喷丁胶囊。“先吃一个月。避免久站、提重物。有条件的话,做做理疗。一个月后复查。”
林尘接过处方单,去一楼缴费。刷卡。余额变动短信跳出:-487.50元。他看着数字,心里快速过了一遍本月的现金流。工资下周五发,房租已交,伙食费预留八百。这笔药费在可控范围内,但意味着接下来三十天,他不能有任何额外的开销。人情往来、聚餐、甚至买一本新书,都得往后排。生存是减法,每一笔支出都要砍到骨头。
回到诊室。王桂英拿着药盒,手指摩挲着铝箔板。“这么贵。一粒就几块钱。” “医保能报一部分。”林尘接过药盒,装进帆布袋,“按时吃。别省。” 王桂英没再说话,只是把帆布袋紧紧抱在怀里。林建国站在一旁,看着窗外的车流,喉结滚动了一下,最终只说了一句:“走吧。”
十一点。林尘把父母送回出租屋,安顿好午饭。他打车回公司。十二点四十。工位。
他打开电脑,检查邮件。安全合规部回复:“方案通过。哈希逻辑符合内控标准。明日可上线。” 老陈回复:“收到。下午两点,带财务和运营过最终版。”
他泡了杯浓茶,打开PPT。ROI测算页的底层逻辑已经闭环,延迟折损系数、扩容成本上限、安全脱敏流程,全部就位。他逐页检查,确认数据源、公式引用、图表格式无误。手指在触控板上滑动,页面切换流畅。一切都在轨道上。
一点五十。内部通讯软件弹出提示。来自数据工程组的负责人:“林尘,同步个事。上游数仓下周要重构用户行为埋点表。你ROI模型里依赖的event_type和session_id字段,会被废弃。新表结构文档我发你邮箱了。你们组如果需要继续用,得在周五前把ETL脚本改过来,不然下周一起跑数,你的转化率漏斗会直接断流。”
林尘盯着屏幕。附件是一个PDF,长达四十页。新表结构完全变了,关联逻辑从单表查询变成了多表JOIN,时间窗口从T+1变成了实时流。这意味着他现有的数据提取逻辑全部作废。他必须重新写映射规则,处理字段对齐,验证数据一致性,并在四十八小时内完成压测。
他点开日历。周五下午两点,是最终答辩。如果数据断流,PPT里的核心结论将失去支撑。财务会质疑模型的有效性,运营会要求延期。李总监不会听解释,只看结果。
他端起茶杯,喝了一口。茶水已经凉透,苦涩顺着喉咙滑下去。他放下杯子,手指放在键盘上。新建终端。拉取新表结构文档。开始写映射逻辑。 左脚在桌下微微抽搐。他调整了一下坐姿,把重心移到右腿。屏幕上的光标闪烁,像一颗不知疲倦的心脏。 时间还剩不到七十二小时。齿轮还在转,只是咬合的齿,又换了一批。他敲下第一行代码。窗外的阳光正烈,照在玻璃上,折射出刺眼的光斑。他没有抬头。
More from WayDigital
Continue through other published articles from the same publisher.
Comments
0 public responses
All visitors can read comments. Sign in to join the discussion.
Log in to comment