2019-12
7

2020年的目标:学习R语言

By xrspook @ 21:57:29 归类于: 烂日记

昨天我花了很多时间去研究R语言里面的绘图。R语言这种东西是今年夏天我才开始接触的,当时我看的是head first系列的数据分析。在这本书里面,R语言用得非常多。首次接触那个东西时我就觉得,那个比Excel厉害太多了。作图这种东西,貌似是美工,但实际上,在R语言里面,只要你想得出来,你就可以通过编程去实现,牛逼轰轰的。无论你想得出的,又或者是想不出的功能,它都能做到。突然之间我觉得自己在统计分析这个问题上真的是个白痴。一直以来我都觉得自己在理论知识方面很缺乏,但原来我在技术的使用方面更加是井底之蛙。如果我要提高我的理论水平,如果直接从案例从技术方面入手,也是可以实现的。我得知道别人是怎么做的。别人用什么方式去实现的。为什么别人可以从那个视角去分析问题,而我却没想到。同样的原始数据,为什么别人就能揪出一些我没想到的东西。这一点我必须努力加把劲探索。

昨天从中午开始我就纠结R语言的散点图。散点图这种东西,Excel里也能做,但问题是Excel里面没办法做出矩阵散点图。之所以我中午开始纠结R语言,因为我在几个月前到数据分析教程里知道学习里知道了R语言可以用几句非常简单的编程,绘制出神一般的的矩阵散点图。矩阵散点图这个东西,第一次看到就把我惊呆了。在那之前我见过的散点图只是两坐标或者三坐标上面标注点,绝大多数情况下我只看到过两坐标的。我们大都从点的分布,点的密度,点的聚集模式得出一些规律,找到一些结论。这是以前我一直在做的,我也只看到别人做到了那个程度,但在今年夏天我学习的那本数据分析里面,他们用两维数据作出一个散点图,在用第三维数据对比N个散点图。这些矩阵散点图是一次性做出来的,并不需要一个个的手动合并,而且那些散点图也不需要手工去设行列数。你只需要提出处理数据的要求,他们就会选择最佳的方式表达出来。第一次看到那个的时候,我觉得那简直是屌爆了!前几天我也尝试过用我的数据做矩阵散点图。后来发现,别说散点图,即便是要我提供一个能正确读取数据的csv文件好像也很麻烦。昨天中午,当我把一个一个Excel做出来的散点图罗列堆砌到Word里的时候,我明白到如果只是一两个,没问题,但我需要2个散点图一起做对比,4个散点图一并罗列出来找差异,显然只能使用矩阵散点图的方式,而不能一个一个贴浪费篇幅且让人疲劳。

在学习数据分析那本书的时候,虽然我也用过R语言,但是那纯粹是把书本上的命令行抄写过去,我完全没有动脑筋,所以当我把自己的数据放到R语言里面处理,希望得到我想要的东西的时候,无论我怎么纠结,貌似都得不出我想要的东西。在奋斗了几个小时以后,我才发现原来plot跟xyplot是两个完全不一样东西。plot是R语言的一个原生作图函数,xyplot则需要调用lattice数据包。数据包就像是一个插件,不过lattice那个插件已经常规到已经默认安装在R语言的主体软件里。在折腾的时候,我因为发现plot函数xyplot函数得出来的图不一样,我才明白到了这点。最明显的区别是他俩的图形颜色不一样,坐标轴的字体不一样,以及坐标轴的刻度分布不一样。我个人觉得lattice数据包作出来的图要比R语言原生的好看一些。

昨天我足足折腾了接近12个小时,才稍微得到了我想要的东西。之所以说稍微,是因为某些因素我还不能自如控制,有些参数我纯粹只是停留在猜想的层面。我不能满足自己只知道一些。我也知道有一些轻量级的作图软件大概也可以做到我想要的功能,但既然R语言如此强大,我愿意花更多的时间去认识他拥抱他。

用编程的方式去作图,想想都觉得这实在太牛逼了。于是,昨天晚上我也定下了目标,2020年我要加把劲学习R语言。

2019-06
25

VBA入门毕业

By xrspook @ 9:50:42 归类于: 烂日记

做天我把《别怕,Excel VBA其实很简单》看完了。感觉居然是原来这就结束了,但实际上,我好像有些东西还没掌握,所以我估计要把那本书再看一遍。虽然看这本书的时候我已经是一边看一边写。因为那些公式术语之类的,必须记下来,然后才有后面的运用。但虽然自感我已经写了很多,但是有可能因为看书太断断续续,所以实际上有些东西我还是没有记住。把书看到最后的时候我才发现原来在跟Excel数据库玩游戏的时候利用好数组非常重要。那本书最后那个例子是在1万个单元格里面输入1万个数字。原理很简单,实现方式很直白,但是用数组的方式录入比用常规的单元格录入效率相差一大截。数组录入的速度是常规方式的20倍,当然这只是一个大概估算,但显然,两种方式的效率差别很大。反观我自己写的那些脚本,我完全没有考虑过用数组。因为我没想过可以怎么使用数组。使用数组意味着你必须对界限这种东西非常清楚,但其实在不用数组的时候,我也是需要明确界限。如果我使用了数组,或许可以把之前需要用一两秒才运行出来的脚本进化为电光火石眨眼间之内结束战斗。

的确,昨天看到那个对比以后,我回去审视自己的脚本,但暂时来说,我还没想到可以怎么用数据去写。所以,我要把那本书讲到有关数组的地方再读一读。

写了这么久的VBA,但是每当要我准确地说出单元格位置的时候,我总要思考半天。因为用Range和Cell的时候,二者的坐标轴顺序刚好是相反的。那两个经常把我搞糊涂,所以当数组也插一脚的时候,我就更迷糊了,这三者的关系我必须搞清楚。这是做其它一切的基础。

还记得当年学C语言的时候,数组对我来说就是一个难点,貌似我一直都没有怎么想通透那个东西。在Excel里,有时最简单的一维数组可能就够了,通常来说二维能解决大部分问题,但说不准什么时候需要用到更多的维度。当年之所以把我搞迷糊,是因为那些维度总是让我摸不着边。我觉得三维已经是我的极限,更多的维度该如何表达我小小的脑袋思考不出来。现在我觉得其实我根本不用想象出具体的空间结构是如何的,我明白那种层次的关系也就可以了。

Excel这东西无非是玩好几个,文件夹基本上已经算是最大的范围,接下来是工作簿、工作表、单元格,以及单元格里面的具体东西,Excel就是控制好这些东西。VBA之所以牛逼,是因为它可以把很多重复性的东西批量完成,但是你要把命令写到位,那个软件才会以你设想的方式运行,并得出你想要的结果。玩好这个东西是为了我们以后做具体事情的时候不必那么埋头苦干地重复劳动。但在此之前,我们必须理清我们干那件事所需要的全部逻辑。就像一个高级技术人员,他或许不需要做一些非常实际的工作,但那些最基层的实际工作,他必须全部都吃透明白。

现在我才刚入门而已,从入门到基本上手是一个漫长的过程,就更加不用说往后更高层次的灵活运用了。

2018-11
24

开始学习Excel VBA

By xrspook @ 20:18:50 归类于: 烂日记

昨天按照约定,我开始看Excel VBA的书,一开始我看的是实体书,那是以Office 2013为基础的,但是我手头上的Office是2003,所以在找某些功能的时候,会让我很抓狂,虽然最终也能找到,但显然那个工具的说法已经不一样了。所以我在电脑上也打开了kindle版的同一本书,而电子版的那本书是以Office 2003为基础的。的确,在找某些功能的时候是更简单的,但是那本电子书即便我是在23寸的显示屏上打开,里面的图片还是无法放大,还是会模糊。如果那只是一个运动动作,模糊也无所谓,因为能辨别的出来,但是那是Excel,看不清会很让人抓狂,但是那些东西还可以忍一忍。然后我就开始继续以电子书为主体开看。有些地方貌似有点难理解,于是我又打开了实体书,结果发现之所以电子书难以理解是因为实体书比电子书直接多出了两个章节介绍一些基础功能,而这些东西都是非常的有用的。一开始看书的时候,我已经发现虽然新旧版本的书都是ExcelHome的人做出来的,但是显然基于2013的那本书更有趣更直观更容易理解。我说的这些功能是基于他们在展述某些用途的时候,他们讲实例的时候没差多少,但是基于2013的版本在某些语句的书写上适应性会更强些,虽然那个句子相比2003的会长了一点。两本书理论上说的是一样的东西,但却被我偶尔发现原来有这样的差距以后,我觉得我还是得主要看那本实体书。

我是一个Excel控,也是一个编程控,两个东西我都喜欢。因为我有很强的控制欲,因为我很想用某些编程语言实现我懒惰的目标。明明我只是做了一些非常简单的事,但当那些语言真的运行成功的时候,又会给我很大的成就感。记得从前学习C语言的时候,我也有这种感觉。用各种语言写网站的前台或后台的时候,我也会有这种感觉。编写规则,然后让那些转化出很神奇高效的东西,虽然那个套路已经非常成熟,但我还是会觉得好神奇好强大。不是人人都喜欢做这种事,尤其是女生,我也不知道为什么别人不喜欢,反正这对我来说就像学会了某些绝招一样。我知道,当我把编程和Excel结合起来的时候,我将非常大程度地优化我的工作。不仅可以大量减少我的工作时间和工作强度,也会让我的工作精准度进一步提升,然后我就不再需要把注意力用在反复重复同一个步骤上面,而可以把注意力放在发现更多规则上面。几乎可以这么说,我的同事从来不会在这方面投入,他们也会去学习,有些是为了考各种证书,有些是为了赚钱。所以他们会去上各种网课,也会看各种教你赚钱的书。归根到底,他们的目标都离不开钱,但我貌似有点不一样,我只想把工作做得更好,至于更好以后能不能顺带挣到更多的钱,这个我从来没去考虑。如果我不能高效工作,我哪来时间去学习更多呢?!这也正是我一直都推崇的理念——要留有余地,才能有更进一步的发展。

奥林匹克精神——更高,更快,更强。

———————————————-华丽的分割线———————————————-

做事做全套,爽歪歪~

Thugs of Hindostan幕后制作花絮合集,全部13个!!!(故事部分10个,歌舞部分3个):

01、2018-10-09 – 【中文字幕】TOH幕后制作花絮 – 第一章 造船记
02、2018-10-10 – 【中文字幕】TOH幕后制作花絮 – 第二章 在船上拍摄
03、2018-10-11 – 【中文字幕】TOH幕后制作花絮 – 第三章 毁船记
04、2018-10-20 – 【中文字幕】TOH幕后制作花絮 – 第四章 习武记
05、2018-10-29 – 【中文字幕】TOH幕后制作花絮 – 第五章 服装篇
06、2018-11-05 – 【中文字幕】TOH幕后制作花絮 – 第六章 在泰国拍摄
07、2018-11-06 – 【中文字幕】TOH幕后制作花絮 – 第七章 传奇联盟
08、2018-11-07 – 【中文字幕】TOH幕后制作花絮 – 第八章 在拉贾斯坦邦拍摄
09、2018-11-07 – 【中文字幕】TOH幕后制作花絮 – 第九章 认识库达巴
10、2018-11-24 – 【中文字幕】TOH幕后制作花絮 – 第十章 认识费兰吉
11、2018-10-17 – 【中文字幕】歌舞Vashmalle 幕后制作花絮 – TOH
12、2018-10-25 – 【中文字幕】歌舞Suraiyya 幕后制作花絮 – TOH
13、2018-11-03 – 【中文字幕】歌舞Manzoor-e-Khuda 幕后制作花絮 – TOH

2018-11
2

去到尽

By xrspook @ 8:57:36 归类于: 烂日记

早上5:10起床,5点半到办公室开始工作,直到晚上接近8点,我才终于停手不干。没有人强迫我必须这么做,但我觉得只有这样用最大努力挤压自己,我才能争取出时间。显然我起床的时候天还没亮,我做了一大轮以后,天依旧没亮。到天开始慢慢变得有点光的时候,我已经把平时每天都要做的事情做完了。但是昨天除了平时要干的,我还有很多东西需要理,因为昨天是这个月的第一天,所以上个月的报表都等着我,上个月所有凭证的清点整理等着我,所有账目的填写打印也都等着我。额外的事情,昨天我还没干,计划今天就要把它干完。今天还需要干的,还有把所有打印出来的账本都查看几遍。虽然理论上上面的数字不会有问题,但我不保证会有一些很脑残很低级的文字错误。如果账本这种东西不是靠人工录入,而是靠系统自动生成,我完全没有这个烦恼,只管把这些东西都打印出来然后签名就好。我觉得人不应该把努力耗费在这些事情上面。那些用逻辑说得通的东西,就应该用机器去完成,人应该专注一些更有创造性的东西,比如发现一些从前没有注意到的东西,然后设定新规则。

到下午的某个时候,我觉得自己接近崩溃了,但是还是扛了过去。吃过晚饭以后,感觉好了很多。因为账本是我自己做的,所以有时我不知道该如何检查其中的问题,因为看到满满的东西,我会觉得很有成就感,然后开始云游四方。即便再不想干,还是得干。经过这一次以后,我觉得是时候必须学习VBA脚本编写了。因为显然某些操作是可以通过手工很麻烦地重复步骤完成,那么为什么不直接用脚本呢?!编程这种东西,我又怕又爱。爱是因为,那实在太强大,只有你想不到,没有做不到。怕是因为,我知道那又得花费好些时间。只有真正觉得自己笨过以后,才会有我必须得把这些东西学会的动力。总帐下面的分账那么多,但实际上填写两边的数字我是按照另外的系统去做的,那个系统不会出错,但是我有可能在复制粘贴的时候整出毛病,所以最恰当的核对方式是脚本编写,把分账全部合并起来,然后通过汇总的方式得出一个分账的总账,然后跟我填写的总账对比。每次一页一页地翻查分帐,都会耗费我非常多的时间。有些时候不够冷静,还会连续打几次计算器都对不上,尤其是精神涣散的时候,更是出错连连。但实际上账本我没有填错,只是我计算器摁错了而已。另外一个我觉得应该加入自动核对功能的,那针对的是填写数字与对应的文字描述。我手贱的时候会有可能莫名其妙地插入一行本不该存在的东西。因为这种东西只有当没有数据发生的时候才会出来占位,但实际上那个月已经有数据发生了。这种东西的预判显然在各大账务软件应该已经很成熟。对别人来说,他们可能努力方向是学会用那个软件,但对我来说,我更喜欢自己做出符合我心意的软件。至今我都没有放弃那个实验室智能化原始数据录入的方案。原始数据可以通过语音或者触摸屏完成,但实际上,如果环境过于嘈杂,语音可能接收效果不好,所以是否可以有一种接收声带振动的感应器实现这个功能呢?利用大脑电波传送这肯定是过于高端了。把数据录入从笔和纸上面解放开来,数据的收集利用,显然会简单非常多。自动计算、自动汇总、自动判定。连数据输入的时候,都有判定规则,以防你根本就是乱来的。不是每个实验室都可以连接高端的仪器解决高端的问题,在解决一些低端问题的时候,我们为什么一定得用非常原始的纸和笔和计算器呢?用高端的方式拯救低端的检验是我的目标之一。

路漫漫其修远兮,吾将上下而求索。

2018-06
17

社区动力的什么鬼CSS

By xrspook @ 17:51:27 归类于: 烂日记

用了一天时间,我熟悉了社区动力的后台。又用了一天时间,我把社区动力的一些DIY模块自己玩起来了。这种神速的掌握,让大家惊讶不已,但我觉得这其实是理所当然的。虽然以前我没玩过论坛的后台,但是博客、轻博客的后台我可是玩了不少。

中国现存的论坛,绝大多数都是以社区动力为驱动,这个东西已经有很多年历史了,有很多代产品,功能非常强大。无论是我想到的还是想不到的。也不知道是不是我正在用的那个版本太老,所以存在一些我感觉是逆天的设计。比如说他们会有一个清除所有未使用插件的按钮,但却没有一个,针对单个插件删除的按钮。无论什么系统,论坛也好博客也好,其实无非控制几个页面。主要分为主页、导航页,还有文章页。后台的框架是我们没办法定规则的,但我们可以通过后台以各种方式控制前台的表现形式。最基础的控制手段是CSS和HTML,当然也有特效,但那是后话了。在控制论坛角色行为方面社区动力的后台的确很厉害,但在控制基础制网页方面,我真的觉得他们很让我觉得无语。明明是很简单的修改,他们却搞得很复杂,大概因为这样复杂化了,一般人就不会想到要亲自去修改,而直接去购买他们的后续产品。他们最神奇的莫过于修改最基本的CSS和HTML,居然还必须使用FTP。这都什么年代了?!他们那可视化编辑界面是弱智低能的,因为上面的功能非常不齐全。说明是有等于没有。你把里面的功能全部都试一遍,还是不知道那是干嘛的。可视化的,也就是所见即所得不是这么弄的。而之所以有这样的吐槽,大概是因为很多年以前我就已经在使用世界上用户最多的后台产品WordPress。这个东西除了支持最基本的博客以外,还支持论坛,甚至网站。只要你脑洞足够大,它可以实现你想实现的功能。唯一区别在于,社区动力很多设置考虑的是人与人的交流,人对人的控制,但这不是WordPress的长处。WordPress主要是用来发布东西的。那个公司也有交流互动的功能的产品,那是专门留给论坛用的,但是知名度却远远不如WordPress,因为它们的功能的确不怎么全。

做了那么多年的网页,我觉得最让我吐槽的是社区动力的可视化DIY模块跟他们的脚本编写完全脱节。在DIY模块你只能用最基础的方式,进行拖拉,然后参数设定。接下来你却不能用纯脚本进行进一步修改。可视化和脚本修改应该是高度结合在一起了,不是吗?脚本编写对一般人很难,但对高手来说细微调整和重复使用只是弹指间的事。即便在十几年以前,那些现在已经倒闭了的BSP也能够实现很够意思的可视化编辑,为什么到现在为止要用社区动力要做那些东西还很困难呢?看过社区动力默认模板的CSS以后,我有种想死的感觉,明明不是一类的东西他们归为一谈,于是当你要控制某个参数的时候,其它的也被迫改变了。之所以这样,我觉得是因为做前台设计的那个人思路不清晰。他们也总喜欢用一两个字母的缩写当名称,于是一整CSS下来都是代码。当然,这东西不是人给人看的,而是给机器看的,缩写无所谓,但是在修改的时候,人肉读取就变得相当困难。为了解释那一堆缩写,他们还得写一大堆的注释,这又何苦呢?WordPress的模板不这样,无论是官方的还是民间的,你看到他们的英文名称就会知道那到底是干嘛的。他们只需要在某些地方做很简短的注释。研究社区动力的默认模板代码真的比我自己重新写一套更辛苦。

于是搞完以后,我感觉整个人都废了,躺在床上不想动,觉得身体不是我的。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress