攻坚的过程比想象中更艰难。数据对接接口调试时,程力带着技术团队连续熬了两个通宵,反复修改代码参数,直到第三天清晨,系统提示“对接成功”时,程力才靠在椅背上长长舒了口气。
林晓一早来办公室,看到他眼里的红血丝,递过去一杯热咖啡:“辛苦了,今天下午给你放半天假,好好休息下。”程力摇摇头:“不用,接下来还有数据清洗,得抓紧时间。”
不同来源数据的清洗与对齐更是个细致活。人社局提供的人才招聘数据里,“人工智能工程师”的岗位名称,在经信局的产业统计里被拆成了“AI算法工程师”“机器学习工程师”,光是统一岗位名称的统计标准,小组就开了四次讨论会。有次晚上十点多,工作组的微信群里还在热烈讨论——小李发了个困惑的表情:“税务局的‘软件业开票金额’和经信局的‘软件产业营收’统计口径差了15%,这该怎么处理?”
程力很快回复:“我查了两个部门的统计制度,税务局是按开票时间算,经信局是按权责发生制算,我来做个时间维度的调整模型,明天早上给大家。”
林晓看着群里的消息,默默给每个人点了个赞,然后在群里发:“大家别熬太晚,身体是革命的本钱,有解决不了的问题,咱们明天一起商量。”
指标权重设置的科学性论证也引发了争论。有人认为“专利数量”应该占更高权重,毕竟创新是数字经济的核心;但也有人提出,“人才净流入率”更能反映产业活力。林晓组织大家开了场论证会,还邀请了高校的产业经济教授做指导。产业经济教授建议:“用层次分析法,结合专家打分和数据相关性分析,这样既兼顾主观判断,又有客观数据支撑。”最终,经过两轮打分和三次模型验证,小组才确定了12个核心指标的权重。
这章没有结束,请点击下一页继续阅读!
老谭看着林晓和团队没日没夜地加班,态度悄悄发生了转变。以前他总觉得林晓一个女同志,干不了这么复杂的项目,可看到她每天最早到办公室最晚离开,有时中午还在啃着面包改方案,还要帮程力他们协调办公室的加班餐,老谭心里不由得开始佩服林晓。有天下午,林晓正忙着写数据对接的进展报告,老谭突然走过来:“小林,你手里的日常事务先给我,我来处理,你专心搞项目。”林晓愣了一下,随即笑着说:“谢谢谭哥,那麻烦您了。”之后,老谭不仅主动承担了处里的文件流转、会议通知等日常工作,还利用自己在机关工作多年的人脉,帮工作组解决了不少非技术性障碍——电网公司的联络员因为工作调整,对接进度变慢,老谭一个电话打过去,对方第二天就重新安排了专人对接。
孙浩也时不时跑来“探班”。他每次来都不空手,要么带几杯奶茶,要么拎着一兜水果,用他特有的幽默给团队打气。偶尔还能动用自己的关系网,帮团队解决问题,有次团队卡在补充参考数据上,孙浩听说后,拍了拍胸脯:“这事儿包在我身上,我认识市场监管局的朋友,明天就给你们要过来。”果然,第二天下午,孙浩就把整理好的数据表格送了过来,林晓接过表格,笑着说:“孙科长,你可真是我们的‘及时雨’。”
那段时间,林晓就像一个高速旋转的陀螺。早上八点到办公室,先梳理当天的工作重点,然后和程力讨论技术进展;上午十点,和各部门联络员开线上会,同步需求、解决问题;下午要么跑委领导办公室汇报项目进度,要么和团队一起调试模型;晚上还要留在办公室,修改项目报告,经常忙到十一点多才回家。同事们都发现,林晓瘦了一圈,下巴尖了不少,但她的眼神却愈发锐利和明亮,说起项目进展时,语气里满是藏不住的干劲。
试点区域和重点产业的选择也经过了反复考量。林晓和团队对比了全市五个区的数字经济基础数据——高新区的数字经济企业数量占全市的38%,研发投入占比达45%,最终确定将高新区作为重点区域;而在产业选择上,考虑到“人工智能”和“集成电路”是全市数字经济的核心产业,且产业链相对完整,数据可得性强,便将这两个细分产业作为监测重点。
当第一批初步的指数结果和分析报告在电脑上生成时,整个攻坚小组都围了过来。屏幕上的数据图表清晰地显示,高新区人工智能产业在自然语言处理领域的创新活跃度(基于专利数据)与相关领域的人才净流入率(基于招聘数据)相关系数达到0.82,属于高度正相关;更令人惊喜的是,通过供应链发票数据的关联分析,团队发现区内三家龙头AI算法公司与五家传统制造业企业,在“工业视觉检测”领域形成了初步的协同创新集群,只是协同紧密度指数仅为0.47,还有较大提升空间。