林远拉近椅子,随手扯过一张A4纸,拿起桌上的签字笔。
“谁告诉你,做信访系统必须用他们提供的台账?”林远在纸上画了一个圆圈,写下“阳光信访”四个字。
欧阳倩皱眉:“没有内部台账,数据从哪来?”
林远握着笔,在圆圈外围画了三个方框。
“第一个框,群众热线96189。”
“第二个框,市公安局110接处警系统开源接口。”
“第三个框,省网信办的网络舆情监测池。”
林远笔尖重重敲击在纸面上,抬眼看着欧阳倩:
“绕过信访局的纸质台账,你写一个爬虫程序,直接从这三个外部接口抓取带有‘信访’、‘举报’、‘群体事件’关键词的数据。
通过身份证号和事件特征进行脱敏比对,自动生成电子台账。”
欧阳倩愣住了。
2011年,绝大多数政府部门的信息化还停留在“手工录入Excel”的阶段。“大数据爬虫”、“跨部门接口抓取”这种超前十年的技术理。
,对她这个中科院数据统筹专业的博士来说,不亚于一场头脑风暴。
林远继续说道:
“老油条们压案不报,是因为他们垄断了信息录入权,那我们就砸碎这个垄断。
只要群众打过群众热线,或者报过警,数据就会被你的爬虫抓取,直接在我们的系统里生成待办工单,他们不交台账,系统自己生台账。”
欧阳倩的瞳孔剧烈收缩。
她一把抢过林远手里的A4纸,目光死死盯着上面的逻辑图。
几秒钟后,她猛地抬头,原本冷漠的眼睛里爆发出狂热的光芒。
“天才的构想。”欧阳倩语速极快。
“群众热线和公安系统的底层接口虽然有防护,但他们的防火墙在我眼里就是纸糊的。
给我三天,我能把他们过去五年的底层数据全扒出来,自动清洗、分类、建立索引。”
“放手去干。”林远站起身。
走到门口时,林远停下脚步,转过头。