2020-09
19

我喜欢Excel

By xrspook @ 20:53:41 归类于: 烂日记

Excel的一般公式,我比较熟练,一些高级公式的叠加,我需要找教程套用,但起码我知道那是可以做到的。一般的数据透视表,是我一直以来用得相对来说最顺溜的东西,至于高级的数据透视表,也就是超级数据透视表我几乎不了解它的高级用法。在数据的筛选查询方面,之前我用的是公式,而近期,我知道了有Power Query这种神器。在这之前,我已经知道可以SQL语言查询。去年我开始系统学习了Excel VBA。这让我大大提升了某些工作的效率。当然这是非常有针对性的。对我来说,要开发一个VBA脚本需要好些时间,并不是一写就能用的那种类型,期间要经过不少修改。所以其实总的来说,对Excel的了解我还是比较全面的。

也正是因为有这样的经历,所以当我遇到某些综合性的问题的时候,当别人把目光主要集中在某个他们很熟悉的版块的时候,我会凭借我的直觉找问题,而不局限于他们觉得出问题的那个地方。比如在把SQL查询跟VBA结合的时候,别人会把精力放在SQL查询有没有写错上面。SQL有没有写错,其实我根本没看,对我来说那些东西太长了,看不懂,而且那个人写的VBA脚本缩进很有问题,看得我很郁闷,所以我就更加没有心情在那里琢磨。那既然能计算出一个正确答案,说明那个查询语句应该没什么问题。也正是因为写脚本的人的那堆东西格式比较混乱,所以我有理由怀疑那是拼凑起来的脚本,因为居然在脚本的开头连变量的定义都没有。为什么VBA里没有进行规范的变量定义,后面也居然可以照样使用呢?这让我有点惊讶,毕竟这是个VBA,不是python。C语言里,如果不先进性变量定义,后面根本用不了。在我记忆之中,VBA的变量在使用之前是需要先定义的。最终我发现是那个人的脚本之所以出错,是因为某些语句的套用搞错了,为什么他会把那个东西放在里?我觉得大概是因为他没有明白他一开始做的那个with是什么意思。但如果你问我为什么他把那堆东西套在里面会出错,而且是某些地方出错,不是全部出错,我回答不出来。理论上这种错误能在恰当的调试中体现出来,但实际上,VBA的调试句子我还用得不算很熟练。或者你会说,这是因为我的VBA学习还不够系统化,但我觉得我已经用了学习VBA最靠谱的那本书了。可以肯定的是,一些很基础的调试方式我还没掌握,如果我学会了那些东西,我可以大大提升我的调试效率,把错误定位得更精准。VBA脚本这种东西,我觉得最根本的是必须得理解。如果纯粹是各种套用,基础功能的确可以快速实现,但是当遇到的问题比较综合的时候,就会出现一些他们完全料想不到的状况。那种状况有可能与脚本本身的内容无关,与脚本的结构有关。

相对来说,Excel里我用得最弱的是高级公式的套用。如何用一个非常复杂的公式解决一些高端的问题是我一直以来都不大上心,或者说记得不够好的部分。非常复杂的公式,尤其是数组公式,虽然能解决一些神一般的问题,但问题是,其实那些公式需要耗费大量资源,所以在处理大数据的时候,非常有可能出状况。我是一个实用主义者,能做到某个功能,但是做起来的效率不高不好,我为什么要选择那种只是看上去很炫酷的方式呢?情况就像用VBA解决同一问题的时候,如果只是在工作表层面处理和先用内存数组处理再在工作表层面表达,效率千差万别。

Excel对我来说,除了要最终结果,过程也得追求高效和方便。

2019-06
14

单机blog梦

By xrspook @ 8:46:14 归类于: 烂日记

昨天blog终于恢复了。在域名那里重新绑定服务器以后,一切终于恢复正常。从6月3号起发现上不了,到6月13号终于恢复整整10天时间,我落下了非常多的东西。虽然中间的那些东西我都有记录,所以只要耐心一点,我都可以补上,但显然一次性补17篇东西也是非常痛苦的一件事。经历过这一次以后,我有了自己在电脑上也保留一份存档的念头。是否有什么软件可以充当简单的数据库,实现blog的效果呢?对我来说,我并不需要界面漂亮,最重要的是记录下文字本身,需要的时候能足够快到达。需要记录的关键信息无非是文章标题、文章正文、记录的时间,文章的分类,以及关键词。

我可以通过标题、时间、正文或者关键词进行搜索,而文章的分类列表允许我把所有那个目录上的文章以某种排序方式展示出来。理论上说,WordPress的数据库结构大概也就这个样子。对我自己个人来说,界面不重要,所以等于无需进行前台版面的设计。要用什么东西实现这个功能呢?在正文里,我需要进行一些格式的设置,通常来说纯文本就足够了,但是某些词句如果能用到加粗和加入超连接会更好。这个东西也必须得默认可以插入图片和视频,图片是内部引用,视频其实就是一个超链接,但是可以在正文展示播放。

我不知道我的这个构想是不是实际上就是一个WordPress的后台结构。这其中没有非常严密的逻辑关系,用不到计算。Office的Wordd能实现格式的功能,而且我觉得格式个功能过于丰富了。Office有他们的数据库软件Access可以实现任何我想到想不到的数据存储及查询,但问题是即便我把数据存储进去,我查询正文出来的东西可能只是代码本身,而不能把某些代码转化为可见的格式。

在我WordPres的后台管理界面,有数据导出功能,但到现在为止,在这个我用了9年多的系统里,我还没试过做数据导出。这让人有点心惊肉跳,因为从2004年高考结束以后,加上在BlogBus的数据,我已经有15年的东西了。我已经不记得从BlogBus搬出来的时候我带着多少数据走人,也不知道在过去投奔WordPress的这几年我又积累了多少。可以预知的是即便全部都是脚本和文字,也一定内容相当丰富。如果导出的只是文字,而且又经过压缩,我估计数据的大小应该不会超过100MB。我不知道,如果我用导出功能会有什么后果。因为理论上,数据库的某个存储单元是有大小限制的,比如我的blog,附件大小最多2MB,所以如果那个导出的数据是一个超过50MB的东西,导出的时候会有什么后果呢?

前几年当Dropbox还能在中国不爬梯子使用的时候,我的网友每天都会把数据库备份,然后自动同步到我的Dropbox账号,但不知道从什么时候开始,已经不这么干了。我的房东是一个IT人士,所以他肯定知道数据备份的重要性,即便他不把那个同步到我的Dropbox,肯定他自己也会同步到某个地方。我不担心在他的管理下,我的东西会有什么问题,而且即便某天真的出状况了,其实每天blog的正文我都是有保存的,缺失的只是每天我发布上去时才写的分类、关键词以及网友的评论。

我总觉得应该有软件又或者有几个软件的联合体能实现我想要的功能。如果真的没有,或许以后某天我会自己整一个。

2019-03
23

不只是中文

By xrspook @ 19:34:46 归类于: 烂日记

还记得大学的某个专业课的老师跟我们说,认真读书,然后找份好工作是为了以后当我们想吃什么的时候,我们可以随心所欲买,而不会有各种约束。当时我学的那门课叫做感官评价。那是很重要的一门食品专业方面的课程,虽然只是选修课,但是我却从中学到了很多。

这门课不需要进行闭卷考试,但是却要交一份集合了几种感官评价方式的资料收集。这其中就包括了翻译,因为我们收集的资料必须是外语的,然后我们需要把核心部分翻译为中文,不需要全文翻译,只需把核心的部分翻译出来就可以了。那门课之前我们的确已经学过了各大数据库的文献检索,但那是我们第一次真的主动自己找那些我们需要的评价方法。这就需要我们要准确把握关键词。那也是我一次也是主动阅读英语论文,他们的版式和思路让我着迷。这种训练在后续完成毕业论文的时候帮了我大忙。这是一项非常重要的技能。

一直以来我都觉得搜索能力非常重要,虽然我一开始上网的时候已经掌握了这个,这也是我接触的最多的。如果不是Google被墙,大概现在我的生活会很不一样。在学校的时候查阅外语文献我们还有校园网,虽然里面的资源可能会有点旧。离开了大学以后要在找那些东西实在太难了,但实际上不只是专业学者需要知道那些东西,普通人也应该可以查阅得到,只不过是下载的时候可能要额外付费而已。但实际情况是不在校园网,外人甚至连进入那个文件检索的平台,于是离开学校后我们就只能回到一开始那样靠普通搜索引擎里查找我需要的东西。我一直觉得专业的东西跟生活是不脱节的。当然,专业尤其是高精尖的生东西肯定必须源于生活高于生活,但那些东西不是在钻牛角尖,不只是为了写论文去做研究,而是因为我们能看出那真的很有意义。说不准马上能帮助人类什么忙,但是在恰当的时候那一定会起到恰当的作用。起码在我做研究的时候,我是这么觉得的,如果连我自己都觉得那没有意义那只是在浪费时间,那只是在应付式的完成任务,我无论如何都不能打起精神去干那种事。我或许会直接跟老师拍板说我不干这个,的确我也干过这种事。质疑老师布置下来的任务的学生绝对是个神经病。遇到这种学生的时候,老师除了生气还有能力祭出大招让学生心服口服的,那更也是非常厉害的存在。我觉得做大学毕业论文的时候,我和我的导师就是这样。现在回想起来觉得这非常不可思议。正是因为曾经做过这种非常规的事,这样的经历足以让我铭记一辈子。

后来我明白到不一定非得在高精尖层面上突破才算厉害,把一些普通的事做到极致其实也很了不起,对我来说这很重要。比如我看过一部翻译得很一般的好电影,我下定决心把那重新翻译,而且我还真做到了,那成为了我的处女作。作为当事人我不能评价我的翻译一定比我之前看过的那个好多少,实际情况是的确已经好了一些,但具体有多少我不知道,最重要的是我曾经为了那个竭尽全力,我很自信,我不后悔。对别人来说这是微不足道事,但这对我来说,做这种事让我感到很幸福满足。认真地竭尽所能的感觉非常好。

我的世界不只是在中文领域。

2017-09
15

连续10小时的战斗

By xrspook @ 9:34:53 归类于: 烂日记

昨天从下午2点到晚上12点,我用了接近10个小时(吃饭+洗澡半小时)去解决一个一键打印的功能。而之所以会这么郁闷,完全是因为制造各种称的大头托利自身散粮称保存数据的模式有点神,说不准他们为什么一定得这么干,这有什么好处,但显然可能这是由来已久的问题。也正是因为这样,过去十年来,我们单位都在默默忍受着这种神奇,而没有像地磅那样,早就已经忍不住要改掉,因为散粮称要比地磅复杂很多。下午我用了几乎一整个上班时间在我的电脑上用模拟的数据研究该怎么去做。在整了两个多小时以后,我总算OK了,当我带着优盘去中控室实战的时候,我知道肯定还会有意外。因为数据模式这种东西,我实在很难预测。去到中控室的时候,基本已经是白班的下班时间。在那里,我把自己折腾了一个下午的方法套进去,套到你一半我就发现这样是不行的。我在那里停留了两个小时,没什么思路,大概是因为饿了,于是我把数据拷走一部分做测试,在回办公楼的路上一直在思考。从那时开始,我就已经有了个念头,我要重新从结构开始,重新规划。因为他们每一个ID流程号的第一条数据每次都会存在净重跟上一个ID流程号最后一条完全一致,但实际上这个第一条他们是不计入新ID总重量的。从前我不明白为什么他们的数据库里面有一列叫做最后一称。在我没到现场,去看这个问题的时候,我会猜想会不会他们把所有数量都跟这个最后一称拉上关系?如果他们把普通的设为1,第一称设为0,所有净重都和这个系数相乘然后累加得出的数是它们的总重量,这就不成问题。但从数据库看来,不是这回事。

在模拟数据的时候,我是可以在表里选择日期的第一条记录或者日期的最小值,获得正确的数据,但实际上在他们的表格里日期的最小值和日期的第一条记录不是一回事。日期的第一条记录不对,我可还可以用日期的最小值,但是如果在做净重的时候,第一条记录无法使用,我没办法用最小值去代替。晚上我又折腾了一两个小时去考虑这个问题,最终我的网友告诉我,表的存储没有时间先后的顺序。所有顺序都是要靠自己手动排序,听了他的那句话以后,我有个灵感就是要把原始的表用一个查询重新按照我希望的顺序排列,最终做到的效果是日期的最小值和日期第一条记录一致。做到了这一步以后,我终于得到了正确信息的条目。我的做法是筛选出每个ID的第一条记录,然后取负数,用那个负数跟原表做一个联合查询,也就是把他们的数据放在一个查询表里。把这个查询作为流水数据的修正版,然后再用之前的筛选方式和联结模式查询。以上我已经在昨晚做到,对比数据,90%已经一致,不一致的部分估计跟操作员的某些操作有关。今天早上我又在早餐前把斗数也修正了。在排列数据的时候我以计数净重的方式生成一个叫做斗数的条目,然后在筛选ID第一条记录的时候同时把斗数设为负数,联合查询操作加入斗数列,最后汇总计算的时候斗数的计算方式从之前的净重计数变成净重求和。这样操作下来,连真算入总重量的斗数也都一同修正了。

10个小时不算多,但对一个普通人来说,这很变态了。我觉得收获满满,虽然只是做了那么一件很简单的事而已。在Excel之后我觉得自己总算有点儿入门Access了。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress