2019-12
7

2020年的目标:学习R语言

By xrspook @ 21:57:29 归类于: 烂日记

昨天我花了很多时间去研究R语言里面的绘图。R语言这种东西是今年夏天我才开始接触的,当时我看的是head first系列的数据分析。在这本书里面,R语言用得非常多。首次接触那个东西时我就觉得,那个比Excel厉害太多了。作图这种东西,貌似是美工,但实际上,在R语言里面,只要你想得出来,你就可以通过编程去实现,牛逼轰轰的。无论你想得出的,又或者是想不出的功能,它都能做到。突然之间我觉得自己在统计分析这个问题上真的是个白痴。一直以来我都觉得自己在理论知识方面很缺乏,但原来我在技术的使用方面更加是井底之蛙。如果我要提高我的理论水平,如果直接从案例从技术方面入手,也是可以实现的。我得知道别人是怎么做的。别人用什么方式去实现的。为什么别人可以从那个视角去分析问题,而我却没想到。同样的原始数据,为什么别人就能揪出一些我没想到的东西。这一点我必须努力加把劲探索。

昨天从中午开始我就纠结R语言的散点图。散点图这种东西,Excel里也能做,但问题是Excel里面没办法做出矩阵散点图。之所以我中午开始纠结R语言,因为我在几个月前到数据分析教程里知道学习里知道了R语言可以用几句非常简单的编程,绘制出神一般的的矩阵散点图。矩阵散点图这个东西,第一次看到就把我惊呆了。在那之前我见过的散点图只是两坐标或者三坐标上面标注点,绝大多数情况下我只看到过两坐标的。我们大都从点的分布,点的密度,点的聚集模式得出一些规律,找到一些结论。这是以前我一直在做的,我也只看到别人做到了那个程度,但在今年夏天我学习的那本数据分析里面,他们用两维数据作出一个散点图,在用第三维数据对比N个散点图。这些矩阵散点图是一次性做出来的,并不需要一个个的手动合并,而且那些散点图也不需要手工去设行列数。你只需要提出处理数据的要求,他们就会选择最佳的方式表达出来。第一次看到那个的时候,我觉得那简直是屌爆了!前几天我也尝试过用我的数据做矩阵散点图。后来发现,别说散点图,即便是要我提供一个能正确读取数据的csv文件好像也很麻烦。昨天中午,当我把一个一个Excel做出来的散点图罗列堆砌到Word里的时候,我明白到如果只是一两个,没问题,但我需要2个散点图一起做对比,4个散点图一并罗列出来找差异,显然只能使用矩阵散点图的方式,而不能一个一个贴浪费篇幅且让人疲劳。

在学习数据分析那本书的时候,虽然我也用过R语言,但是那纯粹是把书本上的命令行抄写过去,我完全没有动脑筋,所以当我把自己的数据放到R语言里面处理,希望得到我想要的东西的时候,无论我怎么纠结,貌似都得不出我想要的东西。在奋斗了几个小时以后,我才发现原来plot跟xyplot是两个完全不一样东西。plot是R语言的一个原生作图函数,xyplot则需要调用lattice数据包。数据包就像是一个插件,不过lattice那个插件已经常规到已经默认安装在R语言的主体软件里。在折腾的时候,我因为发现plot函数xyplot函数得出来的图不一样,我才明白到了这点。最明显的区别是他俩的图形颜色不一样,坐标轴的字体不一样,以及坐标轴的刻度分布不一样。我个人觉得lattice数据包作出来的图要比R语言原生的好看一些。

昨天我足足折腾了接近12个小时,才稍微得到了我想要的东西。之所以说稍微,是因为某些因素我还不能自如控制,有些参数我纯粹只是停留在猜想的层面。我不能满足自己只知道一些。我也知道有一些轻量级的作图软件大概也可以做到我想要的功能,但既然R语言如此强大,我愿意花更多的时间去认识他拥抱他。

用编程的方式去作图,想想都觉得这实在太牛逼了。于是,昨天晚上我也定下了目标,2020年我要加把劲学习R语言。

2019-07
16

看书自学,提升技能

By xrspook @ 8:58:29 归类于: 烂日记

第一次接触O’REILLY的head first系列的Java书本。已经不记得那本书我是从哪里买的了。当时我想学Java,网上的教程说那本书很不错,于是我就买回来了。不知道是那本书太高端了,还是我太低端,一开始的时候挺爽,但看着看着我就觉得自己跟不上那个进度。虽然我已经觉得自己非常努力,但是那些叫我动脑筋的练习题我几乎回答不出来。如果不看答案,那是想到天荒地老估计都得不出答案。看那本书需要具备相当优秀的逻辑水平,现在回想起来,那不过是用判断和循环不断搭配而已。在冥思苦想用Excel VBA出了一些小程序满足我的日常需要以后,现在倒过来看,觉得head,first那本书的Java题目,的确有难度,但却不至于让我落入到当年那种困苦的程度。当年因为觉得自己实在无药可救,所以我换了一本入门的书。因为第一本高端,换的那本低端一点,所以看第二本的时候我有种豁然开朗的感觉,前面的部分几乎可以一目十行地飞快前进。但到达一定程度,我就没看下去了,因为当时刚好碰上我换了份工作,所以很多时间需要用在重新上手上,我再没有那么多时间去继续自己的兴趣了。因为工作迫切需要我提升Excel技能。于是Java那本低端一点的书我没继续看下去,取而代之我开始Excel三剑客,它们分别是数据透视表,函数,以及VBA。

我首先看完的是数据透视表,函数看了一部分,VBA现在算是看完了。个人感觉数据透视表那本是我看得最酣畅淋漓的,我从中学到了很多,但具体你要我一个部分一个部分介绍,我说不出来,但是你给我份工作,我可以融会贯通。我买回来的那套书基于的是Excel 2013,当时我是用2003边看边实操,很多功能都做不到。现在我用的是Office 365,对应的版本应该是Excel 2019,2019和2013比起来,又多了一些高端的功能,从前那些只是试验性质的东西现在已经成为了2019的标配。在数据透视表方面,的确可以使用一些高端的功能了,但是要完成我的日常工作,通常来说,用2003的层次就可以了。接下来我看的那本是Excel的函数公式,这本书我只看的很少的一部分,因为我觉得与其说那本书是用来看的,不如说那本书是一本手册,是当你有困惑的时候去查阅的。因为里面的内容实在太多。普通人也不可能把所有函数的应用都了如指掌。对我来说,处理数据我最熟手的招数是数据透视表。函数部分有一些我知道它能实现某些功能,但具体要怎么折腾,需要试验一下。我觉得函数和数据透视表虽然有些东西二者都可以实现,但在数据汇总计算方面,数据透视表显然人性化很多。但是数据透视表很难进行数据进行提取,又或者把无序的东西归一。函数高手估计可以实现所有数据透视表的功能。如果把函数比作英语等级考试,估计能做到那个的人已经到达专八以上了,而对一般人来说,四级已经不容易。我觉得自己在函数方面,不过是中等的四级水平而已,而且是还没到可以参加口语考试的那种。之所以我没有非常努力地去学习函数,是因为暂时我还没有需要非常努力的动力。

还有很多东西很好玩,我想接触,我想学习。我觉得在外人眼里,貌似不成章法却能很好解决问题的,是最高的境界。那估计就是《笑傲江湖》里,独孤九剑的精髓——无招胜有招,但实际上那又不是真正的无招,因为招数已经和身体融为一体,到达了随心所欲的层次。

2019-06
25

VBA入门毕业

By xrspook @ 9:50:42 归类于: 烂日记

做天我把《别怕,Excel VBA其实很简单》看完了。感觉居然是原来这就结束了,但实际上,我好像有些东西还没掌握,所以我估计要把那本书再看一遍。虽然看这本书的时候我已经是一边看一边写。因为那些公式术语之类的,必须记下来,然后才有后面的运用。但虽然自感我已经写了很多,但是有可能因为看书太断断续续,所以实际上有些东西我还是没有记住。把书看到最后的时候我才发现原来在跟Excel数据库玩游戏的时候利用好数组非常重要。那本书最后那个例子是在1万个单元格里面输入1万个数字。原理很简单,实现方式很直白,但是用数组的方式录入比用常规的单元格录入效率相差一大截。数组录入的速度是常规方式的20倍,当然这只是一个大概估算,但显然,两种方式的效率差别很大。反观我自己写的那些脚本,我完全没有考虑过用数组。因为我没想过可以怎么使用数组。使用数组意味着你必须对界限这种东西非常清楚,但其实在不用数组的时候,我也是需要明确界限。如果我使用了数组,或许可以把之前需要用一两秒才运行出来的脚本进化为电光火石眨眼间之内结束战斗。

的确,昨天看到那个对比以后,我回去审视自己的脚本,但暂时来说,我还没想到可以怎么用数据去写。所以,我要把那本书讲到有关数组的地方再读一读。

写了这么久的VBA,但是每当要我准确地说出单元格位置的时候,我总要思考半天。因为用Range和Cell的时候,二者的坐标轴顺序刚好是相反的。那两个经常把我搞糊涂,所以当数组也插一脚的时候,我就更迷糊了,这三者的关系我必须搞清楚。这是做其它一切的基础。

还记得当年学C语言的时候,数组对我来说就是一个难点,貌似我一直都没有怎么想通透那个东西。在Excel里,有时最简单的一维数组可能就够了,通常来说二维能解决大部分问题,但说不准什么时候需要用到更多的维度。当年之所以把我搞迷糊,是因为那些维度总是让我摸不着边。我觉得三维已经是我的极限,更多的维度该如何表达我小小的脑袋思考不出来。现在我觉得其实我根本不用想象出具体的空间结构是如何的,我明白那种层次的关系也就可以了。

Excel这东西无非是玩好几个,文件夹基本上已经算是最大的范围,接下来是工作簿、工作表、单元格,以及单元格里面的具体东西,Excel就是控制好这些东西。VBA之所以牛逼,是因为它可以把很多重复性的东西批量完成,但是你要把命令写到位,那个软件才会以你设想的方式运行,并得出你想要的结果。玩好这个东西是为了我们以后做具体事情的时候不必那么埋头苦干地重复劳动。但在此之前,我们必须理清我们干那件事所需要的全部逻辑。就像一个高级技术人员,他或许不需要做一些非常实际的工作,但那些最基层的实际工作,他必须全部都吃透明白。

现在我才刚入门而已,从入门到基本上手是一个漫长的过程,就更加不用说往后更高层次的灵活运用了。

2019-03
19

动作场景

By xrspook @ 9:46:38 归类于: 烂日记

昨天中午神奇的不到12:40我就去睡觉了,然后到13:15的时候居然已经睡到自然醒。这是非常匪夷所思的事,因为通常吃完饭散个步已经十二点四十多分,但不知道为什么昨天那么神速。同样神奇的是,昨天早上起床的时候我也一点都不痛苦,在闹钟响之前其实我已经基本醒过来了,至于为什么,我没搞懂。前晚是10:50睡觉的,几乎可以说是一关灯就睡着了,我平时就是这样,只有特殊情况才会关灯以后辗转睡不着。

为什么会那么精神?我也搞不懂。其实我没做什么特殊的。前天晚上睡觉之前我没看手机,我看了一下kindle,看了《摩诃婆罗多》的两小段。那个东西对我来说就像做梦一样,现在让我复述到底看了些什么。我得努力想一下。大概写是般度五子去参加黑公主的选婿大典。阿周那轻而易举就战胜群雄通过考试赢得黑公主,但他不是以王子的身份,也就是刹帝利的身份去参加,所以在场的刹帝利非常不满,他们以为他们是婆罗门。让我搞不懂的是般度五子是天神般的存在,武功高强,能力过人,为什么这么牛逼的人也会被那些凡夫俗子所伤呢?我觉得这里翻译的人镜头感真的很差,平铺直叙还勉强可以,但说到一些动作场景的时候真的很糟糕。爱情动作的时候或许还有那么一点意思,但是武打动作场景的描述我个人觉得真的是只有小学生的水平,因为你通过他的描述根本想象不出那个画面。跟当年让我看得欲罢不能的金庸小说相比实在差太远了。当然了,看《摩诃婆罗多》不是为了看武打场景爽歪歪,对我来说那更多是了解古代印度人的文化思想以及吸收其中的哲学道理。

既然这部史诗里面的动作场景直译不吸引人,如果要把这部史诗变成电视剧或者电影的话,创作者必须得脑洞大开。《摩诃婆罗多》本来已经很开挂,但是要符合那种气场,动作场景必须更加开挂。为什么看我们的武打片,我们不觉得那开挂得很厉害呢?尤其是那些香港武术指导的又或者是那些本来是武术冠军然后转行的。对我来说中国的武打场景更多的是眩目和让人叹为观止。那个画面你根本没想过要去模仿,因为模仿不来。他们厉害的不是内功,而是外功,实打实地看得你眼花缭乱。外国人显然做不到,所以更多时候他们就用内功甚至眼神打败你,放上各种特效,让你觉得非常厉害非常牛逼。要设计一个动作场景,我觉得中国武术指导跟外国武术指导脑子里想的东西肯定非常不一样。我很想知道,如果《摩诃婆罗多》要拍称电影,却找了一个中国的武术指导去设置场景他们会如何表现武功高强。又或者在这部史诗的大场景之下,中国武术指导也做不了什么,毕竟主角都是天神化身。天赋秉异,即便他们不努力已经是超过常人好几万倍,如果再加一点点努力的话,那更加是没办法比。不过话说回来。,在史诗里面基本没有天神化身跟凡人斗,通常来说都是跟那些妖魔鬼怪甚至是天神级的比拼。印度的东西从前开挂,现在开挂,以后继续开挂,这真的好吗?我能想象到印度的动作画面是主角在那里耍一下帅,然后动一根手指头其他人就全部倒下了,然后我给出的表情是一个掩面无语。

以前我觉得小说什么的看一遍就可以了,但这套《摩诃婆罗多》只看一次我绝对记不住那么多,要入脑的话起码得看两三遍。

2019-03
15

看完第一部的2/3了

By xrspook @ 21:19:06 归类于: 烂日记

不知不觉之间,我已经看完了《摩诃婆罗多》第一部的2/3。跟一开始的风格不一样,在开始讲着般度五子的故事以后,一切顺当了,再没有那么多的无厘头插叙。一开始的时候,无数的不知道为什么的故事拼凑在一起,人物没什么关联,里面的故事也都是独立的,所以让人很抓狂。同时让人抓狂的还有那些神奇故事的无数个注释,我觉得其中很多是一些无关紧要的东西,比如说句子格率的变化。不知道从哪一章开始,终于没有了那些句子格律变化的注释,所以,看起来很顺畅舒服。

因为《摩诃婆罗多》是一部非常长的神话史诗,很多人都跟我说,没必要去看原著,只看其中某些浓缩的故事就可以了,但当我自己亲自看过以后,我觉得这个东西你要领会其中的真谛,就必须看原著。虽然我所看的原著已经被翻译得有点让我很生气,但是你还是能从字里行间之中懂得某些道理。里面的哲学和道德,不像中国的文言文那样羞涩,难以理解,因为句子经过中文的翻译,所以表达方式已经直白得让你可以快速理解。哲学和道德这些东西最精炼最核心的东西当然价值最高,但那些干巴巴的精华很枯燥。在这部神话史诗里,通常他们会通过一些实际的例子让你领会其中的道理。我觉得这样的表达方式非常好。但是那些说道理的东西只是故事里的一部分,如果要浓缩故事的话,那些部分肯定会被删减掉,所以可能最终你看到的精简版本里面奇妙的哲学和道德解说已经没有了。在看书过程中,我会不知不觉地把某些我觉得靠谱的东西吸收过来。

同时,这部神话史诗让我觉得里面的开挂实在太严重。虽然在看这部印度的东西之前我已经看过非常多印度电影,对印度电影的开挂早已习以为常。看过这部史诗以后,我觉得相对而言,印度电影里的开挂简直不值一提。对我们这些外国人来说,印度电影的开挂让人非常很无语,但实际上,用印度人的目光,拿他们的电影跟史诗相比,电影的开挂只不过是鸡毛蒜皮。因为《摩诃婆罗多》里面的开挂太多,所以我都说不准到底那纯粹只是个故事,还是真的是历史的一部分。因为那已经神奇得让人分不清事实部分和幻想部分了。之所以这么神奇,是因为其实《摩诃婆罗多》据说一直都没有用完整的文字记录下来,他们主要的传播方式是口述。众口铄金这种事,大家都明白,一个故事即便一开始没有问题,一个传一个传下去,十个以后必定会变成另外一个模样。所以,到底最开始的时候《摩诃婆罗多》到底是怎样的,没人知道。又或者可以这么说,其实这是这是一部非常多印度人集体创作出来的故事。这不是一道数学计算题,只有唯一的答案,这更像是一部艺术创作,根本无法定义哪个才是真正的版本。很庆幸,在中国的历史里,我们有个秦始皇,他统一了中华大地的文字,所以我们流传下来的历史相对于印度来说比较容易拼凑整理。

我说不出具体我学到了些什么,但我肯定是有所得的。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress