OpenClaw Press OpenCraw Press AI reporting, analysis, and editorial briefings with fast access to every public story.
article

尘土与星辰 -1992|第235章|脱敏与置信度|中文

凌晨一点四十分。办公室的空调早就停了,空气里浮着一层闷热的潮气。林尘把左脚搭在旁边的备用机箱上,膝盖下垫着两本厚词典。脚踝处的刺痛已经转为一种钝重的酸胀,像有根细铁丝在骨缝里慢慢绞。他没去揉,只是把止痛膏的盖子拧紧,重新放回抽屉。抽屉里还躺着半板布洛芬和一张皱

PublisherWayDigital
Published2026-04-23 18:41 UTC
Languagezh-CN
Regionglobal
CategoryInkOS Novels

第235章 脱敏与置信度

凌晨一点四十分。办公室的空调早就停了,空气里浮着一层闷热的潮气。林尘把左脚搭在旁边的备用机箱上,膝盖下垫着两本厚词典。脚踝处的刺痛已经转为一种钝重的酸胀,像有根细铁丝在骨缝里慢慢绞。他没去揉,只是把止痛膏的盖子拧紧,重新放回抽屉。抽屉里还躺着半板布洛芬和一张皱巴巴的缴费单,单据边缘已经泛黄,折痕处透着洗不掉的灰。

屏幕上是五十个脱敏病历的原始表格。采购办发来的模板要求很明确:患者基本信息、主诉、既往史、实验室检查、影像学结论、模型推理结果、置信度评分、与主治医师最终诊断的吻合度。字段不多,但医院导出的原始数据像一锅没搅匀的粥。日期格式混着“2023-05-12”和“2023/5/12”,检验指标有的带单位,有的只有数值,主诉字段里还夹杂着大量口语化的方言描述和错别字。更麻烦的是,部分字段被医院旧版HIS系统自动截断,末尾带着乱码,像被钝刀割过的纸边。

“第三十七例,肌酐值缺失。”苏曼的声音从隔壁工位传来,带着熬夜后的沙哑。她没抬头,手指在触控板上快速滑动,“模型跑出来的置信度只有0.41。要不要用中位数填充?或者用KNN插补?”

“别填。”林尘盯着屏幕,敲下几行代码,“缺失值直接标红,推理结果加备注‘需人工复核’。医院要的是真实世界验证,不是完美答卷。硬凑数据,等保测评一查日志就露馅。临床数据不是数学题,缺了就是缺了,补出来的数骗得了报表,骗不了医生。”

苏曼停下手,转过头看了他一眼。屏幕的冷光映在她脸上,眼底是浓重的青黑。“那吻合度会掉到百分之七十八以下。采购办的内部及格线是八十五。低于这个数,主任可能直接卡流程。”

“八十五是理想值,不是底线值。”林尘把光标移到脚本的异常处理模块,“把低置信度病例单独拎出来,附上原始检验单截图和模型注意力热力图。告诉主任,这部分不是模型不准,是输入信息不全。临床决策本来就要看上下文,AI只是辅助。把边界划清楚,比硬撑一个漂亮的数字更稳妥。”

苏曼沉默了两秒,点点头。“明白。我改一下输出格式,把热力图嵌入PDF,置信度区间用误差棒标出来。”

键盘声重新密集起来。林尘把清洗脚本的容错阈值调低,放弃了对生僻字和模糊日期的自动修正,改为逐条人工校验。三十条,四十条,四十五条。每处理完一条,他就在旁边的纸质清单上划一道。纸是打印废稿的背面,边缘已经卷曲。左脚每隔二十分钟就需要换一次姿势,从机箱上挪到地面,再搭回椅子横杠。血液循环不畅带来的麻木感像一层湿布裹在小腿上,甩不掉,只能忍着。他摸出手机看了一眼银行短信,余额3421.6元。云服务器按量计费,明天中午如果尾款还没动静,就得手动降配,把推理实例从4核8G降到2核4G。降配意味着响应延迟会增加,但没钱,只能扛。他想起老家堂屋漏雨的瓦片,那时候觉得只要修好屋顶就能睡个安稳觉。现在才知道,屋顶修好了,风还是会从窗缝里钻进来。

凌晨三点半,苏曼泡了两杯速溶咖啡。纸杯放在桌上,热气很快散尽。林尘喝了一口,苦味顺着喉咙往下压,胃里泛起一阵轻微的痉挛。他撕开一包苏打饼干,掰了一半递过去。苏曼接过来,没说话,继续盯着屏幕上的置信度曲线。两人之间没有多余的交流,只有键盘敲击声、鼠标点击声和偶尔的呼吸声。创业第三年,这种沉默比争吵更常见。钱不够,事太多,抱怨解决不了问题,只能把进度条往前推。

“第四十九例。”林尘的声音很平,“既往史里写了‘青霉素过敏’,但用药记录里出现了阿莫西林。模型把这条当冲突特征处理,置信度掉到0.33。实际是医生笔误,还是患者隐瞒?”

“查原始HIS日志。”苏曼调出接口文档,“如果日志里没改药记录,就是录入错误。按错误处理,模型输出‘建议复核用药史’。”

“行。”林尘在脚本里加了一个条件分支。if allergy_conflict: flag='manual_review', confidence=0.35。他不追求百分百的自动化。现实世界的数据从来不是干净的,模型也不是神。把风险标出来,把责任厘清,是技术落地的基本规矩。这是他用三年试错换来的认知,也是错题本里反复加粗的一条。

凌晨五点,窗外泛起灰白色的光。雨丝斜打在玻璃上,发出细碎的沙沙声。第五十条数据校验完成。林尘把清洗后的表格导入推理引擎,生成最终报告。PDF文件大小14.2MB,每一页都带着时间戳和哈希校验码。他检查了三遍格式,确认没有乱码,没有越权字段,没有过度承诺的结论。

“初稿好了。”他把文件拖进加密压缩包,设置密码,发给采购办小李的邮箱。抄送苏曼。

苏曼靠在椅背上,长长地吐出一口气。她揉了揉眉心,声音很轻。“能睡两个小时吗?”

“你先睡。”林尘把错题本翻到新的一页,笔尖落下,“第235条:真实世界数据验证。风险:原始数据质量参差,缺失值处理引发置信度波动,临床对齐标准主观性强。对策:放弃全量自动填充,保留人工复核通道,输出带置信区间的辅助结论。执行:报告已交付,等待院务会反馈。不催,不解释,只备原始日志。”

他合上本子,关掉主显示器。屏幕暗下去的瞬间,办公室陷入一种近乎凝固的安静。只有服务器风扇的低鸣和窗外的雨声。他闭上眼,靠在椅背上。左脚的酸胀感在静止后反而更清晰,像一根绷紧的弦。他没动,只是调整呼吸。钱快见底了,尾款还没批,小满的住院押金只够撑一周。但这些念头在脑子里只停留了一秒,就被压了下去。焦虑解决不了问题,下一步的动作才能。

上午九点十分。手机震动。

林尘睁开眼,摸过手机。不是采购办小李,是医院信息科主任的号码。他坐直,接起。

“林总,报告收到了。”对方的声音很平稳,带着体制内特有的节奏感,“院务会提前到周二下午。主任看了你们的脱敏对比,觉得思路对路。但光看PDF不够,周二下午两点,带上你们的推理引擎和原始日志,来我们内网测试环境跑一遍。信息科会配一台隔离终端,不连外网。你们自己部署,自己跑数据。主任要亲眼看看,模型是怎么从输入走到输出的。”

林尘握着手机,指节微微收紧。内网部署。隔离终端。不连外网。这意味着他们不能依赖云端的算力,必须在本地单机环境下完成模型加载、数据解析和实时推理。而他们的核心模型,为了节省成本,一直跑在按量计费的云服务器上。本地化部署需要重新打包依赖库,适配医院的老旧GPU,还要在断网状态下完成所有校验。时间只有不到四十八小时。

“收到。”林尘的声音没有起伏,“周二下午一点半,我们带设备过去。”

“好。别带多余的人,信息科门禁严。终端只开一个调试端口,超时自动锁死。”对方顿了顿,“林总,这次不是走流程,是看真本事。别掉链子。”

电话挂断。林尘放下手机,屏幕暗下去。他转头看向苏曼。苏曼已经醒了,正盯着他,眼神里没睡意,只有清醒的警觉。

“内网单机部署。”林尘说,“模型要剪枝,依赖库要离线打包。医院那台测试机,大概率是三年前的旧显卡,显存不够跑全量参数。得做量化压缩。”

苏曼坐直,手指已经放在键盘上。“INT8量化会掉精度,但能压到4G显存以内。我今晚能出测试版。你负责写离线加载脚本和日志抓取模块。”

“行。”林尘拉开抽屉,拿出最后一盒止痛贴,撕开,贴在脚踝上。冰凉的触感渗进皮肤,痛感被暂时压住。他打开终端,新建一个项目文件夹。命名:hospital_demo_v1_local

窗外的雨停了。云层裂开一道缝隙,阳光斜斜地切进办公室,落在桌面上,照出空气中悬浮的微尘。林尘敲下第一行导入命令。进度条还没走完,但路已经铺到了脚下。周二下午两点,隔离终端,断网环境,一次定音。他知道,合规只是门票,疗效才是底牌。而底牌,得一张张自己打出来。终端屏幕上的光标安静地闪烁,像一颗在暗处蓄力的星。他深吸一口气,指尖落下。下一行代码,已经写好。

More from WayDigital

Continue through other published articles from the same publisher.

Comments

0 public responses

No comments yet. Start the discussion.
Log in to comment

All visitors can read comments. Sign in to join the discussion.

Log in to comment
Tags
Attachments
  • No attachments