2020-11
24

2020只剩下一个月了

By xrspook @ 9:35:11 归类于: 烂日记

昨天当我重新配置VSCode的时候,我发现python的东西我好像都已经忘干净了。之前几个月,我花了那么多时间去研究折腾,现在,除了最核心的东西,格式上的问题我好像全部都忘干净了,大概研究一下就可以重新上手,但现在如果叫我写脚本,我会彻底一片空白。同样一片空白的还有我的git的文件夹。换了个硬盘,要重新配对上显然不容易了。当时放到网络上的东西只是一部分,最根本的那些我还没往上面放。所以这就意味着其实我的电脑还是要装一个git的,然后把那些东西整理好以后往上放。什么时候才做呢?我自己也没想好。之所以没想好,大概是因为我还有一个羁绊。

今年我们已经写了两篇统计分析,但无论写多少,年底还是得有一篇对应2020整年的分析。那个东西该怎么写?如果按照从前的套路,直接在从前的数据上面更新数据,肯定没什么难度,但是我要做的显然不仅仅是那些,因为每一年的状况都会略有不同,最重要的我觉得是把握那些不同点,但我也明白不同点只是一部分而已,整体的思路还是得延续从前的风格,但从前的风格是不是一定就靠谱呢?具体的细节我还没想好要怎么整,整体的规划,暂时也没有一个很确切的想法。现在我我的状态是想做又不想做,摇摆中。情况就像我想逃避,但我又非常明白这根本逃避不了。还剩下一个月的时间。这个东西必须得整出来,我知道其实一个月的时间很充裕了。要解决一个细节上的问题,几天就足够。但毕竟这不是我一个人做的事,所以我不能把那算得那么死。应该用什么样的风格?应该用什么样的图表去表达呢?今年前两个分析,跟之前的风格不一样,因为都是专题类的,要凸显出某些东西,而这一次,全年的分析显然侧重点不在那里。这是我重新接手统计的第四年。印象之中,前几年我好像从来没有在这个问题上费过多少心。现在,数据的整理已经常规化,所以我会在细节问题上纠结。从前如果要做一个年底的分析,我大概是到年末的时候才开始整理数据,但现在每个月末我都会整理。所以总的来说,我的查询表相对而言已经比较固定完善,但这也说不准什么时候我又蹦出来有一些新想法,是之前的那些数据收集方式无法覆盖到的。在2020年里搞定这些事,接下来的那两个月不过是等过年而已,没有烦恼。秋普已经过去,剩下最后一个比较大型的就只有绩效考核。如果你问我,春秋普查慌一点还是绩效考核慌一点,其实我都无所谓。如果我说两个我都不慌的话不知道有没有人会相信,因为实际上,那些检查要求做的事,在日常工作中我已经都做了。

我的方糖12月28就可以完成最后一次的打卡,如果能坚持到那一天的话,方糖2就算是被我白嫖到了。理论上,在那一天之前,我就应该完成今年的统计分析的绝大部分,剩下的只有更新最后几天的数据而已。

纠结要做什么的时候是最浪费时间的。

2020-10
19

工作的羁绊

By xrspook @ 14:45:11 归类于: 烂日记

到处去玩这种事貌似从来不能引起我的兴奋。学生时代每个学期的旅行很让我期待,但到底期待的是不用做作业、有零食吃还是喜欢玩本身呢,我实在说不清。可以肯定的是即便去了旅行,回来之后语文的游记还是少不了的。虽然其实写游记也不是太痛苦,但欢乐之后有种这样的作业始终会让人觉得不尽兴,但起码旅行那一天没有测验考试。我已经不记得小学时的旅行具体去过什么地方了。初中的时候我们去过长隆动物园和东方乐园,当时的东方乐园已经接近关闭状态,所有东西都旧旧的。据说我妈带过我的表哥去东方乐园,而且我妈去的时候东方乐园才刚开不久,为什么她就不带我去呢?从前我对机动游戏很感兴趣,但现在,那些东西再不能激起我的兴奋了,再过几年,估计会更加无感。因为我是晚婚晚育的孩子,所以当我年龄适合的时候我妈已经对那些东西没兴趣了,她注定不会带我去玩那些东西。

现在更加作死,无论是法定假期还是外出培训,对我来说根本就没有一天可以闲下来不工作的时候。从前外出的时候我带着笔记本电脑,因为我要写blog,我要上网,去那些小众的地方,但现在,让我非带着笔记本电脑不可的原因是我要继续处理单位的数据。一年到头就只有几天空闲。只要我速度快,每天的量其实我用几分钟,顶多30分钟就完成了,但每天都得有这么个心理负担,要处理那些东西。处理数据和写游记到底谁简单一些呢?处理数据完全不需要脑子,但游记的思路来了以后就是行云流水的操作。白天我可以随便玩,但到了晚上,我必须得纠结单位的数据什么时候出来,是不是只有一些而没有另外一些。没有人强迫我必须得这么干,但我觉得把东西堆到第一个工作去做更痛苦。我注定不是那些下班以后就可以拍拍屁股玩消失的人。这是一个简单的工作,但同时这也是一个困身的工作。之所以这么折磨,完全那是因为我把这件事太往心里去了,如果我是一个不怎么上心的人,估计不会有烦恼。生产线上的工人不在生产车间就没烦恼,我这种人无论身在何方,有数据就得干活,虽然除了远程处理数据以外我还有必须现场处理的实物纸质资料。今年国庆节8天假期,据说5号就开工,结果其实后面4天不是天天都有作业,但我还是得天天蹲在那里观察。那几天即便有作业也很少,与其每天都只是一点点,为什么就不能把那个押后到国庆节结束后再干呢?一方面我知道没东西干对单位不好,另一方面,我想真正放个没工作的假。过去这3年,我试图让自己习惯这种和数据共处全年无休的方式,虽然我已经优化了很多东西,让每日的工作尽可能地高效,但貌似和数据捆绑在一起的这个心魔我仍然挥之不去,不只是没有减轻,更有越发深刻的趋势。以前这么干是总公司逼着必须得这样,但现在,不是他们管辖范围内的东西,我仍然这般要求自己。

我注定不是个享受旅游的人。

2020-08
21

懒精自动化

By xrspook @ 8:24:58 归类于: 烂日记

对别人来说,做某件事就是从系统上读取某些数字,抄在纸上,然后不断地敲计算器,得出某些数据,然后再按照某些格式整理成别人要的样子。之前我也是这么干的,但是我觉得,这实在是太累人了。我要做的不仅仅是读取系统上的数据,我做的是读取我自己的数据,然后跟系统上的做比对。做的东西必须是最小单位。明细对好了,后面的汇总是水到渠成的事。我觉得,汇总数据这种事,规则我定下来,结果应该是自动生成的,管好我的明细数据,汇总数据就不会出乱子。汇总数据出来了以后,还得按照某些格式整出来,这其实是一个填坑的过程,但是应该怎么填呢?逻辑的思路就是,如果有数据就展示出去,如果没有数据,就为空。这是主要思路,但某些细节问题其实也是需要考虑的,比如说数据与数据之间的标点符号:逗号,分号,句号,冒号等等。没有数据的时候,那个地方是空,但是在连接两个数据之间,有些人默认带入了标点符号,于是就会出现一个神经质的状态。数据与数据之间有一大堆莫名其妙的标点符号,正常情况下,那些东西都不应该存在。按照人的思路,那些东西根本不可能存在,但为什么有那些东西呢?显然是那个做判定的人没有把标点符号写到判定里。什么时候应该逗号,什么时候应该句号,当没办法判定哪个才是最后一个的时候,标点符号怎么办?其实真的不能判定吗?肯定是可以的,当某个元素的序号等于这个数组的最后一位,显然那个东西就是最后一个了。在Excel的世界里。尤其是不考虑VBA,只考虑前台的公式,这个逗号的判定在我现在的能力范围之内,的确有点难,所以遇到这种情况,我干脆每个数据给它一行,每行数据的末尾,不加任何标点符号。

昨天我突然意识到,Excel的公式编写是可以插入空格和回车的,当然,空格和回车要加在恰当的地方。比如加在数据连接的地方,不要加在某个函数里。又或者其实加在某个函数里面也是可以的,但是如果你在表达字符串的地方加入了很多空格,最终的结果肯定会哭。也正是因为回车的加入,让我的公式看上去更整洁了,我不用纠结不断地眼睛急转弯。复制粘贴也变得相当的容易。的确复制粘贴很简单,但是粘贴得多了,每一行的数据框架都是一样,只是修改了里面的部分内容就会让我自然而然想到使用循环。如果Excel的公式里有for或者while这种循环该多爽。换句话说,为什么就不能有循环呢?之所以这样,大概是因为Excel,没想过你要么在某个单元格里面展示一堆合并起来的字符串。这种字符串的合并,理论上更应该出现在Word或者普通的txt里面。

我首先写了个索引,然后写了个数据,接着对数据进行数据透视表,最后写了个很长的公式。根据数据透视表和数据透视表以外的一组数据,生成了两段字符串。字符串里面所有数字的格式全部都严格按照我需要的模样输出。这样做的确实现了我想要的功能,但我感觉还是有点麻烦,如果写个VBA,加入数组,这些东西很容易就能表达出来。从前前台看来,也会干净利落很多,但问题是,加入VBA的话。Excel的保存格式就得改变。对小白来说,VBA是个洪水猛兽。他们不知道该不该允许宏这个东西。如果我是他们,我不了解这个东西。这个东西的确有安全隐患,我肯定不会主动打开,即便我知道这个东西可能很强大。

开源的东西用起来得花一些步骤。组装好的东西用起来的确用很爽,但问题是,万一里面有猫腻呢?归根到底,还是自给自足、自娱自乐比较好。

2020-08
1

真的是软件在欺负你吗

By xrspook @ 17:10:03 归类于: 烂日记

前几天,我的一个同事跟我说她现在用的是WPS,在筛选数据的时候,一个数据源每一次筛选出来的东西都不一样,今天是一个总数,明天又是另外一个总数,问我会不会遇到这种事情。首先我跟她说,我根本不用WPS,因为它不能满足我的要求。其次,我用Excel时候,从来不会发生这种事。她跟我说,筛选少量数据的时候,没有这种问题,但是数据量一大,就会出现状况。我没遇到过这种问题,我信任我正在使用的软件,同时,我的软件,也没有背叛过我。然后就没有然后了。她没有叫我去她那里实地给我演示一下WPS是怎么把她整死的,我也没有主动要求去看一下,到底WPS在搞什么鬼。我觉得,不是WPS搞什么鬼,是她的数据格式有问题。最大的可能性是不够规范。非常有可能出现了合并单元格之类的东西,也有可能数据粘贴过去,某些单元格里出现空格之类的玩意。各种各样奇怪的现象都有可能发生。之所以有这种感觉,是因为几乎每次她给我看一个新表,里面都有一些奇怪的东西。

对我这个Excel控来说,那些瑕疵是完全不能存在的,比如说我最讨厌的类型——明细表格里有合并单元格;也比如表格的标题模棱两可,让你不知道那到底是什么;第三次是逻辑思路混乱,根本搞不懂一个表格里勾稽关系到底是怎么样的。于是这也难怪为什么领导布置下来的东西,她不得不一次又一次交上去,因为领导要觉得不满意,叫她一再返工。别说领导不满意,我这个路人甲也看不过去。领导为她好的话,怎么会不让她返工呢?一方面我觉得,其实领导的这个做法挺好,因为他没有给你设定好你到底要怎么干,你按照我思路去干就可以了。他给了你一个思考的空间让你琢磨,这是个让你进步的好机会。但你交上去的东西老是不合他的要求,谁都会上火。

之所以会发生这种事,其中一个原因我觉得是在她自己设计那些表格之前,见过的表格太少了,尤其是非常复杂的。什么东西应该放在一起,什么东西不能放在一起,她没有一个很明确的思路。自己的知识库容量不够,当然不可能折腾出知识库范围以外的东西。其他人是怎么处理这些数据的呢?他们用的是什么工具?什么表格?什么方法?领导是这么要求的,但是我觉得我的这套方法比领导要求的更清晰,更不会出错,我可以跟领导解释我的用法,如果合理的话,我觉得领导不会有意见。情况就像我们做毕业答辩的时候,就应该有这么一个底气,在这个课题上,我花的时间和精力都很多。比台下评分老师了解的还要透彻,虽然他们的经验比我丰富。所以,在我的这个课题上,我应该很有信心。但是,绝大多数人都不会这样,于是就会出现毕业答辩的时候被下面的老师批得一塌糊涂却哑口无言。有可能是他们对自己的课题根本不清楚,也有可能纯粹是因为太紧张了,脑子转不过来。

规则在你手,数据由你去整理。如果你都没有一个靠谱的处理方法,别人怎么会放心。不觉得自己不靠谱的方式有问题就是最大的不靠谱。

2020-07
29

垃圾表格

By xrspook @ 10:49:22 归类于: 烂日记

昨天我看到一张单,上面的东西几乎没有一样是对的。表格的设置一团糟,里面的数据牛头不对马嘴,简直不知道那些人是如何填表的。他们到底是如何从一个路人甲,长进到知道该如何填那些表格的呢?为什么他们填那些表的时候不觉得那个表有问题呢?收表格的人看到表格里信息乱七八糟,对不上的他们也没有上心。明明知道错的,也不叫填表的人去改。真的没办法改吗?如果没办法改的话,为什么没有多一个审核人呢?让我觉得最郁闷的是,那个表上面居然没有一个制表人!没有打印出来的名字,也没有手签的名字。要找人负责,应该找谁呢?是因为没有制表人的签名,找人负责的时候不知道找谁,所以谁的脸都不丢吗?!自己的脸不丢,单位的脸丢光了,为什么这种事情居然会发生呢?外面的审计单位,如果真的翻到这些东西。他们肯定会觉得我们极端好笑。一张这么简单的表上面都错漏百出,其它地方出现幺蛾子太正常了。表里面的数据前后对不上,就更加不用说这张表跟那张表,今年的表跟去年的表能不能衔接,能不能对上。如果这一套东西毫无逻辑可言,这套东西想不出错实在太难了,而且也是根本不可能不出错的,而且出错的东西简直是随机播放,挑战你脑洞的极限。上周我去检查别的单位,同一个数据用在三个地方,三个不同的结果,已经让我很震惊了。一直以来,我们都用昨天我看到的那套莫名其妙的表,要不出错根本是不可能的,出错的效果可能会比上周我去检查的那个单位还要夸张、还要严重。做毫无逻辑可言的事情,即便你再勤快,也是没有用的,因为你的勤快都不得用在考虑非标上面。没有规则,所有东西都是特例,这工作还怎么进行得了!

在进行blog数据转换的时候,我更加明白到执行标准的重要性。blog是一篇一篇的写出来的,但是,要让一个blog真的体现出价值,必须积累到一定程度。这个积累必须有一定的规则,内容可以天马行空,但是组织方式得有一个套路。哪些元素是一个模式的,哪些地方不能用奇形怪状的符号,这些都是规则,只有把这些规则都严格遵守了,一篇一篇的blog加起来才是一个知识体系。只有每篇blog的内容都符合系统的识别要求,不让系统有歧义处理错误,这些文章叠加起来才能真的起到作用,而不会在往后的使用过程中导致各种瘫痪。我是个标签狂人,我会用你想到想不到的东西做标签。从前我的标签非常五花八门,各种稀奇古怪的符号都有。这让我在数据转换过程中尝尽苦头。如果我单纯地只用中文或外文的组合没有问题,因为在数据转换过程中,不会让系统产生歧义。但如果我用了一些我觉得很普通的标点符号,问题就会很大,制造出来的麻烦超乎我想象。这就是规则的重要性,如果当初我知道这些规则,我绝对不会用那些符号作为标题、分类或者标签。我知道了这些东西的危险性,所以我不用了,但我的那些同事,根本不知道他们那个非标表格的危险性,还继续一直套用。作为一个旁观者,我瑟瑟发抖啊!

不是每个人都会在工作问题上斤斤计较。随大流是绝大多数人的做法。没有进行拿来主义的经验做法是害人害己的,用之前想一想,就那么难吗?

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress