找自己麻烦
本来打算只搞30分钟的东西,结果我搞了三个小时都不止。想想都觉得很疯狂,于是整个晚上就变成了加班。上班下班对我来说没有非常明确的界限。我确信我正在做的事情是工作的一部分,但是从来都没有人强迫要求我必须这么干。跟我去纠结电动牙刷的电池一样,我完全是出于我想知道,所以我去纠结。
没人在乎那一公斤的东西该如何分配,折腾了我一个晚上,但不是这一公斤我算错了,而是貌似我把有多少件物体加起来一公斤的物体的件数给搞混了。总件数没有问题,但细分下去就有毛病。之所以会发生这种事,是因为当时我制定那个校验规则的时候完全没有考虑过件数。数量是可以核对的,但是件数不行,纯粹靠我自己去把握。为什么总数没问题而分类会出现误差,这个问题我折腾了三个多小时,虽然没搞清楚,但可以明确的是,因为我在分类里又细分了太多东西。我不可以一步到位进行计算,我要经常进行各种排除。一共有4个大类件数,其中三个跟我之前的对不上。我个人觉得,这样实在太糟糕了,虽然每个分项之间只差一点点而已。为什么之前会搞错呢?怎么会搞错的呢?之前我到底是用什么方式把那个组合出来的呢?现在要搞清楚当时的思路实在太难了,因为那是一年多以前整的,我当时到底用了什么操作呢?现在我已经完全不记得了。因为是在晚上核对,而且连续干了三个多小时都未果,所以我确定继续下去我的脑子不会好使,与其继续纠结,不如回去睡觉。或许今天早上突然之间我就有灵感了,比如说前天我在改进明细数据的结构,根据某些报表的习惯,我把某些东西拼在一起,但后来经过深思熟虑以后觉得那是不可行的,因为某些数据按照某些规则,几乎可以这么说,可以无限拆分,但另外一些,我暂时觉得是没有拆分必要的,而且其拆分方式跟之前的那些不一样。之前的那些数据不进行变态拆分的时候,这两种数据是可以放在一起的,但是当前面的玩起了无限拆分,要把前面和后面的数据放在一张表里作为汇总表的明细数据显然不可行。昨天早上起床后上厕所的时候,我突然意识到这个问题,于是一上班我就开始着手把我前天硬是拼在一起的东西分开,把可以无限拆分的继续拆分。拆分出来的两种数据,我都可以轻易的通过我手头上的资料快速地把它们变形出来,而不需要像前天那样全部都人肉处理。
想得越多,写的分析越多,越会感觉到自己的基础数据不够仔细分类不够合理。从前觉得很靠谱的分类方式现在看来挺傻听天真。当时的目标导向性很强,但是可塑性不高,没办法把那些数据作进一步组合利用。这些年来跟数据打交道,让我明白到,只有把最基础的东西分类好,后面才可以玩得转。
数据处理和分析是一个持续改进的过程。