第78章 眾生相之徐璐的成长3(1/2)
2个月前,20:05 空荡荡的办公区
徐璐盯著监控屏上跳动的告警信息,手指无意识摩挲著键盘边缘。
半小时前发生的归档进程阻塞事故已经解决,但刚进公司一个月不到的小李在故障处理时误刪归档日誌的阴影还在心头縈绕。
她调出操作审计日誌,突然听到身后传来咖啡杯轻磕桌面的声响。
“徐姐,这么晚还喝真不怕睡不著吗?” 刘洋倚在隔断旁,看著满屏的ora-00312错误代码,“要不要试试我的解压大法?” 他晃了晃手机,屏幕里面是连连看...
徐璐刚要拒绝,目光扫过工位旁积灰的团队合影——那是三年前容灾演练成功后拍的,照片里大家举著“零宕机”的锦旗笑得灿烂。
现在锦旗还掛在茶水间,但上次集体活动已经是半年前了。
“帮我约a区三楼的会议室。”她突然调出知识库文档,“明天下午三点,把上次erp索引丟失的事故分析加进材料。”
第二天15:00 a315会议室
投影仪在幕布上投出醒目的標题:《那些年我们填过的坑》,副標题写著“资料库故障復盘故事会(第一期)”。
徐璐把马克笔塞给缩在角落的小李时,发现对方眼神有点躲闪,不由反省自己是不是真的这么可怕 。
“从我开始吧。” 她点开自己加密的故障日誌文件夹,大屏上突然出现五年前的邮件截图:
————————————
主题:紧急:生產库控制文件损坏
內容: 今日凌晨因存储阵列故障导致所有控制文件丟失,当前资料库无法掛载...
“当时我刚休完產假。” 徐璐的声音平静得像在讲別人的故事,“用老控制文件强行open时触发了ora-01578,偏偏备份磁带机正在检修。”
会议室响起倒吸气声。
几个老员工交换眼神——这是部门禁忌话题,当年因为这个事故差点丟掉运营商大单。
“我抱著笔记本在机房坐了18小时。” 她调出当时手写的恢復流程图,“最后用隱含参数_allow_resetlogs_corruption打开资料库,然后立刻做全库逻辑导出。”
刘洋突然举手:“但oracle官方明確警告过这个参数会...”
“会破坏数据一致性。” 徐璐接话,“所以导出数据后我们对比和校验了三天三夜。”她点开满是红线的校验报告,“找到137处数据块校验错误,全靠开发团队连夜写修復脚本。”
投影切换到感谢名单,二十多个泛黄的名字里,徐璐用红圈標出三个:“这三位前辈已经离职,但他们的日誌分析工具现在还在知识库里。”
16:20 转折时刻
当小李颤巍巍站到台前时,徐璐忙里偷閒正用平板给女儿回消息。
“昨、昨天我误刪归档日誌...” 实习生刚开口就哽咽了,任谁工作第一个月就犯了大错都不好受,“当时徐工让我用rman做增量备份,但我忘了检查控制文件...”
徐璐突然起身走向白板,在“人为失误”的分类栏下重重画圈,说道,“这个標籤该撕了。”
她在眾人错愕的目光中调出操作审计日誌,又补充道:“你们看小李的操作时序——他在刪除前三次尝试过crosscheck命令,但系统提示归档日誌验证失败。”
刘洋突然直起身:“等等!如果crosscheck失败,说明归档日誌早就损坏了?”
“没错。” 徐璐点开存储系统的smart检测报告,“硬碟早在三天前就出现重分配扇区激增,但监控系统没设置预警閾值。”
她把马克笔拋给存储组的老岳,“这个坑是不是该你们填?”
会议室突然活了过来。开发部的人抢著讲编译器优化引发的隱式锁升级,网络组吐槽防火墙重置丟包害他们背了三次锅。
小李悄悄擦掉眼泪,在本子上记下“智能监控閾值动態调整算法”。
17:45
徐璐整理著散落的便签纸,发现刘洋在“归档日誌自动修復”的构想上写写画画。
“徐姐,下周能不能加场?”刘洋抱著笔记本电脑凑过来,“我想讲分布式事务时钟偏移的问题...”
门口却突然传来陈默的掌声。
不知何时倚著门框的陈总晃著咖啡杯,一脸欣慰的说道,“案例会实录记得发知识库,我让其他团队也来取取经。” 他指了指白板上徐璐画的故障分类框架,“这个很实用。”
徐璐低头收拾投影线,发现小李正给运维组演示他刚写的日誌分析脚本,屏幕上的代码注释里挤满顏文字。
一天前,人事任命公布当天,徐璐在车库偶遇到陈默。
本章未完,点击下一页继续阅读。