2018-12
14

非变不可

By xrspook @ 23:59:29 归类于: 烂日记

不明白今年的很多事为什么进展得那么快,平时1月或者2月才干的事现在貌似都要堆在12月就搞定,搞不懂为什么会这样,但快点来也是件好事。最让我头痛的是现在单位的数据不到最后那一刻都没办法终止。准确来说,几乎可以这么预计,2018年我们是没办法完成理论上应该做完的事的,其中的原因很复杂,有外部因素也有内部因素。有一些是上级部门压过来,非要我们这么干不可,但是有些东西不由我们掌控,其他单位不配合,我们一点办法都没有。因为数据没办法停止,最后的确切东西我也就没办法定下来。没办法,这个是客观因素,但实际上,有些东西已经成为历史,已经可以记录下来了,但我却选择等所有都好了以后才去做,究其原因是因为我不确定中间会不会有一些错漏,总体一起来进行交叉检查容易发现其中的问题,但是既然数量停不下来,我要等到最后那一刻显然是不现实的。昨晚洗澡的时候,不知道哪来的决心,今天开始就策划年底最后的那份东西,在策划那个之前,或许我得把还没打印出来的账本全部都先打印出来。

打印账本和签名是一个很繁琐的过程,但你却不得不做。虽然很无聊,但人家检查的就是那些东西。虽然我也知道来检查的那些人不会真的非常严格抠我那些鸡毛蒜皮,但无论是大错还是小错,发生了就是我的责任。10月份打印过一次账本,如果1月再来检查,可以12月底把一整年的都搞定,但现在如果要提前到12月就过来检查,那么我必须这几天就把11月的打印出来。理论上这只是增加一条记录的工作量,但实际上,为了能节省纸张,少签名少盖章少划线,全部我都得用很麻烦的方式套打。如果那个东西跟金蝶一样,打印出来以后无需签名无需盖章,我真的不会管那么多,反正噼里啪啦打出来就好,但显然我那些东西不是那么回事。所以为了少做一些后续人肉上的多余工作,我要做多很多电子表格层面的格式修改。其实我有想过,是不是做一个宏会比较简单,但现在我还没有100%把握能控制好那个东西,所以,暂时还不能那么干。以前我曾经奢望过新的智能系统上线以后,我的账本就真的可以像金蝶那样打印无忧了,但从现在的情况看来,那只是我的奢望,最终能不能做到都是一个问题,就更不用说近期之内实现了。我一直坚信的是只要我能想出来,而且能实施,就必然能用机器代劳。那个思路必须是正确的,我要做第一步的摸索。就像从前做C语言的练习题一样,按照机器的思路先去人肉运行。

今天我已经想通,明天就得去跟领导说要买Office 365正版软件的事。相比于买断版本的2016,我觉得我们更值得使用的是每年都得给几百块钱的Office 365,至于是买个人版还是家庭版,那就得靠领导去做决定。两个版本的价格相差不远,只差一百块钱,但是一个只能支持一个账号而另外一个可以支持六个账号,显然从划算的角度考虑,肯定用家庭版靠谱。万一领导觉得这个软件现在只有我有非常迫切的需求,其他人都没必要,那么,可能最终买的就是个人版。但也会出现这么一个状态,领导会觉得,既然你觉得这个软件不贵,为什么你不自己不掏钱买呢?买这个软件是为了能更好地完成单位的工作,如果撇开工作本身,我无需买这样的软件,因为我根本不用做对应的很多事。接近400多块钱的花销对一个单位来说,就是一个人出差住宿一个晚上而已,肯不肯花这个钱,纯粹只是看他们觉得有没有必要在数据处理方面做花销。

现在已经到了,非变不可的地步了。

2018-12
13

改进

By xrspook @ 10:14:35 归类于: 烂日记

总是抱怨别人这里不好那里不好,其实不如抱怨自己,到需要采集数据的时候我才发现自己的一些设置不完善。有些数据需要聚合,有些数据需要拆分。到底如何把握那个度,至今我仍没有一个确切的答案,把数据聚合起来的确可以让我省事。有些要拆分的东西如果不把那分开,根本没把得到一个正确的答案,但是如果把数据拆分得太多,到聚合的时候你又真的是不知道该如何下手了。规则是我定的,但当我自己整理的时候也发现问题,理论上这个东西可以通过设计好正确的逻辑去避免,但问题是,连我自己都说不清,我怎么能要求别人做出我需要的效果呢。今年的数据收集我基本沿用的是去年的方法,但明年我会对数据进行一些增加或者减少一些不必要的工作量,完全就不需要一再重复了,这样可以减少我每天处理基础数据的时间,而在一些没办法通过基础数据整合出来的东西,我必须用更详细的方法记录下来。今年让我很麻烦的那些拆分与整合的数据,是因为今年一开始的时候我一直没有做好收集工作,而是过了大半年以后我才开始着手慢慢找回来。虽然这样也行,但是数据多的时候自然就会默认产生惰性,批量生产的时候人难免会犯错,那个错误到底在哪里,你又实在是说不清。

我觉得最应该改变的是我要把正在使用的Office系统换掉,从2003换成2016,因为在数据查询方面,2016加的某些功能是2003无论如何都做不到的。比如说数据的不聚合功能,通过那样的方法可以轻松地对文字进行数据透视,但2003的数据透视表就只能把所有信息用数字的方式表达。明明可以通过窗口界面进行的外部数据联合查询,但是在2003里就只能使用脚本编写,虽然也能达到类似的功能,但显然这有点繁琐,而且必须小心翼翼,稍有差错就没有然后了。2016很早我就想换掉了,但是我需要使用的电脑是我家里那台跟我单位工作的这一台。该怎么说服领导让他给我买正版软件呢?或许别人会说用WPS不行吗?显然,Office跟WPS不是一回事,差太远了!专业的人不会用WPS,因为那只是一个高仿,核心的东西他们永远放不完全。2016这个东西貌似网上没有一个完美的破解版。几乎所有破解的版本最后只能过一段时间就去注册一次,才可以让软件继续使用。与其这么麻烦,不如直接买正版。半年之前,到处都可以买到2016的正版,但现在,微软官方商城的价格被提到非常高,而其它我知道有卖正版的地方貌似都已经不卖了,至于为什么,是因为微软在推他们的Office365。他们希望你每年都为软件给钱,而不是一次性地把软件的使用权买断。这样的话他们就可以一直赚钱,同时也保证了你可以一直使用他们的更新服务,让你的软件随时保持最新版本。对联网的人来说是完全没有问题,但是,在中国这种特殊的国情之下,有些时候,我们的网络真的不怎么好,虽然理论上的网速很快,但实际上让人很着急。使用盗版软件是我们一向的作风,使用正版软件还是得每年都给钱,这会让人有点难以接受。我个人觉得给钱买服务这完全是可以的,但估计我的领导不这么认为。虽然,只要我提出要求,估计他们会允许我在这方面每年都投入几百块钱买正版软件。别人不会向他提这个要求,因为他们的工作不会迫切地需要用到这个。这也是我跟他们很不一样的地方。但同时我也会遇到这么一个问题,领导会不会说你找一找有没有破解版本,那么就可以省下一笔钱了。虽然即便那笔钱省下来了,还是不会到我的口袋里去。既然付得起钱,为什么要用盗版软件呢?破解版某些功能是憋足的,你得到完整的售后服务,何必呢。

我需要变好就必须改变,要改变就必须得思考总结。

2018-11
30

旋风图

By xrspook @ 9:55:37 归类于: 烂日记

我看过无数次,怎么用Office 2016或者2013制作旋风图。但昨天是我第一次用Office 2003做那个图。理论上,都可以做到,因为利用的最基础的图表是柱形图,但当你真的要做的时候,会发现一搜索铺天盖地都是2007以上的版本,于是你就很纳闷,因为在2003的版本里面你找不到他们所说的那些按钮。在某一个网页里,我终于找到了应该是2003的版本,因为从那个配色看来,是那么回事,但实际上那里说的那些东西又好像大概只能把我引导到门口,最后那一步无论如何都进入不了。之所以会发生这种事,是因为他们加入了辅助列,直接把数据从正数变成了负数。理论上我觉得这个是没有必要的,因为这只是把轴顺畅地变成负数,最后通过修改数据的显示方式,把负数再变成正数,挺折腾的。

在中午吃饭之前,我已经差不多成功了,最后那一步,还没摸索到,当我吃完饭回去以后发现,原来就只差一步,把最小值设置为。主坐标轴或者次坐标轴的,最大值相反数就行,而且把Y轴与X轴相交于0。这样的做法就等于把主坐标轴跟次坐标轴都扩大到可以容下反向坐标轴。第一次做出这个的时候,我非常高兴,但马上我发现问题了,因为我把图例放在靠上的位置,但是坐标轴的颜色跟图例的颜色刚好相反了,于是我就重新改一次主坐标轴和次坐标轴。我觉得最容易改的估计是图例的显示顺序,但我不知道为什么我会选择把坐标轴折腾一遍。大概只有通过这样才能会让我加深记忆。我曾经试过把Y轴的标签放在两个坐标轴之间,这样理论上跟美观,但实际上会造成左右两个坐标轴的单位长度不一致。虽然X轴的标签我是不会再放的了,但你看两边柱状图的具体数据还是会有问题,之所以这样,大概是因为我只在一侧为了对称好看不断地增加空间。

有人试过做两个柱状图,然后把它一起显示。左右柱状图,再加中间一个图表构成了三联的旋风图。我觉得这样做有点多余。标签不放在中间放在一侧也没什么问题。我需要做旋风图数据左右两侧的最大值不一致,一个只有3万多,一个超过5万。也正是因为这样,所以我在设定坐标轴最小值的时候就必须有所取舍,而不像网上的例子那样,两边都是一样的值就OK了。因为网上的例子大多是用百分比只显示,最大值也就只有1,所以不会遇到我这么多的问题,但我觉得,第一次做这种东西遇到很多问题是件好事,下次再做这个图的时候任何版本的Office我都不会再彷徨了。如果不做旋风图,其实我完全可以做一个堆积柱状图,但如果把这两种图对比的话,显然旋风图更牛逼。不过话说回来,如果里面包含的数据不只是两个,而是多个,还是做堆积柱状图比较合理。

什么样的数据选择什么样的图标是一个学问,如果你经验丰富,你可以不加思索就选择出靠谱的,但如果你只是个新手,或许你真得用一下Office 2016的那个推荐图表,因为他们会很清楚地告诉你应该用什么图,这个图有什么优势,你不应该用什么图,那个图会会有什么问题。那个软件不只是让你能完成任务,而且还会教你如何应对问题。

每年的统计分析都是一个斗智斗勇的过程,其间学到的很多东西让我觉得很有趣,虽然过程有点折腾有点虐。

2018-11
29

Excel做图

By xrspook @ 10:05:16 归类于: 烂日记

昨天一整天我都沉浸在写统计分析之中,很多图我都没做,而只是看了个大概然后就继续写下去,但因为没有图,写出来的东西当然肯定会缺少点什么。之所以不做图,一个原因是Office 2003做出来的图相比于2016的的确有点丑,我想用笔记本的2016做图。第二个原因是,实际上我统计的那个数据还有最后的一些还没有出来,所以有些数据还不能确切地定下来。Word里的图通常我都是从Excel里面直接粘贴图片过去,没有确切的数据贴过去的图,当然也就肯定得被替换掉。这次的统计分析我觉得我写得好像有点单调,因为我用的基本都是直方图,以前我没想过要大量使用这个,以前我用得最多的是柱形图。而这次之所以用直方图而不用柱状图是因为我不想把具体的数据全部罗列出来。对读者来说,他们没必要知道我们的仓号有哪些,我们的客户有哪些。一定程度上,把数据太明细地反映出来就有点暴露我们的信息。他们真没必要知道全部,所以我就选择了直方图,用统计频率的方式来体现效果。

Office 2003的方直图不出现在插入图表那里,而是在数据分析里面的。那个功能出来的东西有点复杂,我摸索了一阵才知道我要的到底是什么。直方图是个很牛逼的东西。但现在我就只是用它体现个频率分布。一直以来我都说要学习一些专业一点的统计,但实际上这一年下来我几乎没看过那种书。因为我不知道,当然我就没想出要用什么方法去表现我的东西,所以基本上我就从头到尾都在搞直方图。在某个数据表达上,我想用树状图,出来的效果很惊艳,但是也很浪费空间,而且表达出来的数据如果不加上鼠标,没办法体现全部。如果那单色打印在白纸上面,效果会更糟糕。我用了一个直方图和一个直方图图,外加一个柱状图才表达出一个堆积柱状图的东西,为什么我要浪费那么多的空间做了三个图呢?!我觉得Office 2016的树状图和旭日图是非常牛逼的存在,但实际上出来的效果并不好,因为如果数据一边倒,那些代表数量很低的东西根本没办法体现,于是那反而不如传统的饼图,又或者是我一直用得很多的柱状图。

这次的统计分析里的表格我用了三线表,这貌似是我第一次自己新建我自己的表格形式。之前,我只是一直都在套用最普通的表格。三线表是科技论文里必备的东西,让我觉得很奇怪的是我正在使用的Office 2003版本里面居然没有三线表。在我记忆之中,那应该是存在的,而且那个表是绿色的线条,但我找了半天都没找到,所以干脆自己做了一个黑色线条的。我知道Office 2016里可以做树状图,但是昨天我找半天都没找到,最后发现原因是我打开的那个工作簿是2003建立的xls文件,当我把工作簿另存为xlsx或者xlsb等高级的形式后,插入图表那里就出现了树状图和旭日图。如果xlsb里面没有2016创建的图表,而只是有数据,2003可以通过添加插件转换文件的方式打开并编辑那个东西,但是如果在2016里面插入过图表,再用2003打开这个文件的时候就会显示转换失败无法打开。所以最终虽然2003的图有点丑,但我还是全部选择使用2003画图。因为这是我第一次使用2016做图表,格式设置真的要找很久。下一次当我把手头使用的所有电脑都换成2016的时候。大概我才会真的放弃用2003来做图。

为了把事情认真做好,任何时候我们都得把心操碎。

2018-11
20

xlsx与xlsb

By xrspook @ 9:26:05 归类于: 烂日记

昨天我把平时都要更新的大型数据文件都从xls转变为xlsb。之前的那个文件没有删掉,而是把它记下最后的日期,放到某个地方,今天开始在新的文件里更新数据。到昨天为止,这个月坚果云的使用量是899MB。经过这样的数据转换以后,理论上,单位每天更新的数据应该不会超过5MB,除非有特殊情况,比如说要写一个比较大型的报告之类的,而里面又有很多图。如果Excel表格里面有很多图,估计就没办法缩小体积了吧。Excel可以在后面加个b缩小体积,那么Word可不可以也这么干呢?真的能把图片压缩吗?估计今天我得研究一下。格式转换的操作我是在Office 2003上面完成的,当然这必须得装一个转换插件才能正常运行,我顺便在WPS 2019上测试,打开xlsb文件没问题。我也把那个东西发给了在用WPS 2016的同事,她打开也没有问题。最后我在我的新笔记本电脑上也试着打开一下,同样没有问题,当我把xls文件转变为xlsx文件,在新的笔记本电脑上进行各种复制,结果发现数据透视表没有绝对相对引用的问题。也不知道是前天还是昨天我看到这么一条消息说Office 2016推荐的系统版本是Win10,几乎可以说,那个东西是Win10的定制版本,而Win7和Win8推荐的Office系统是2007或2010。于是这也就容易理解为什么我新笔记本电脑上的Office 2016没有数据透视表绝对引用的问题,但是在Win7上面哪一台机都有问题。不只是2016,2013也存在同样的问题。所以得出这么一个结论,如果要顺畅地使用2016,我的系统最好用Win10。估计这不是Office补丁补丁的问题,它们是配套使用的,虽然Win7和Win10都有32位和64位两种系统,但鬼知道Win10在Win7的基础上又改动了些什么。Office 2016之所以出现绝对引用地址的问题,是Windows的office模板那里有毛病。我不知道笔记本上的预装Windows以及office系统是怎么装上去的,估计不是人手一台一台来,但显然他们装上去的步骤是一个整套的流程,是一体的。现在卖的笔记本电脑基本上都是正版的家庭版Win10外加家庭版的Office2016。虽然现在最新的office应该是2019,但是微软最推荐你使用的是Office365。显然,买笔记本电脑的人估计不会愿意每年都给一笔费用使用Office365,所以2016就算是个比较稳定靠谱的选择。之前我已经听同学说过她的一些同事有些人用Office 2016没问题,但有些人有问题,我觉得估计不是软件版本的差异,而是他们Windows系统的差异,因为有些人用的Win7,而有些人用的Win10。

今天我之所以选择xlsb,而不选择更通用的xlsx是因为我知道xlsx文件在2016上用数据透视表,有可能出现绝对引用的问题,但现在显然在我唯一一台装了2016的电脑上没有问题。我需要把它换回来吗?其实没这个必要,因为xlsb文件的体积大概只有xlsx的一半。b和x的区别在于,b是二进制的工作簿,在一些软件上打不开,在没有安装office的前提下,x文件你还可以改它的后缀,改成zip文件,然后解压浏览里面的东西。x文件的通用性显然更强。但对我来说,我是不装office会死星人,所以这根本不成问题。b结尾的文件一般软件打不开,所以一定程度上是不是二进制的工作簿安全性更好呢?而之所以一个体积比另外一个大,是因为x文件里除了数据本身还有各种各样的xml格式。

微软这个博大精深的东西,即便我愿意花钱买2016,但只要我的Windows系统还是win7结果还是会死得很惨,所以想花钱也不能随便花。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress