又过了半小时,第二本统计完。对上了,符合本福特定律。
于是,王大卫就更懵了。这玩意怎么时灵时不灵呢?那就没办法了,只有加大样本量,下一本,换支马房的试试。
王大卫一口气又试了六本。结论:四本能对上,四本对不上。
崩溃啊!崩溃。
眼看要中午了,洒家怎么交差?难道跟王叔说我画了一上午的“正”字?
说到底,查账这活儿需要找出哪个数字有问题,被篡改过。可我就是没这本事嘛!鬼才知道合理范围应该是多少。还这么多,两房涉及的条目我估计得有好几百种,愁死了。
或许,可以试试另外一种笨办法。
一种类型的数据,按时间排序,应该是一条相对平稳的曲线。即便有起伏,也应该大差不差。所以,如果出现“离群点”的话......
不过这工作量太大,非人力所为,得靠计算机,那就必须先文字识别。
翻开一页,王大卫喜上眉梢。虽然都是手写的,但写得非常工整,换句话说就是,匠气十足,跟印刷的似的。
要的就是印刷体,识别率高。感谢大宋的公文书写制度。
来来回回穿了好几次,工作完成。还真被王大卫找出十四处离群点。十四张图表也画好了。横轴是时间,纵轴是价格/数量,离群点圈出来,写清楚来源于哪一本哪一页......
王大卫抱着工作成果,走出西耳房。
“叔,忙着呢!”
王韶抬头,老怀大悦。大卫这孩子真不错,整整一上午,待在房间里埋头苦干。比老夫家那个小混蛋可强多了。
用手一指,道:“坐。自己搬把椅子。”
“好嘞!”王大卫落座,将怀里抱着的账册和纸张放在案头。
王韶含笑点头:“看起来,你干了不少嘛!”