2019-12
7

2020年的目标:学习R语言

By xrspook @ 21:57:29 归类于: 烂日记

昨天我花了很多时间去研究R语言里面的绘图。R语言这种东西是今年夏天我才开始接触的,当时我看的是head first系列的数据分析。在这本书里面,R语言用得非常多。首次接触那个东西时我就觉得,那个比Excel厉害太多了。作图这种东西,貌似是美工,但实际上,在R语言里面,只要你想得出来,你就可以通过编程去实现,牛逼轰轰的。无论你想得出的,又或者是想不出的功能,它都能做到。突然之间我觉得自己在统计分析这个问题上真的是个白痴。一直以来我都觉得自己在理论知识方面很缺乏,但原来我在技术的使用方面更加是井底之蛙。如果我要提高我的理论水平,如果直接从案例从技术方面入手,也是可以实现的。我得知道别人是怎么做的。别人用什么方式去实现的。为什么别人可以从那个视角去分析问题,而我却没想到。同样的原始数据,为什么别人就能揪出一些我没想到的东西。这一点我必须努力加把劲探索。

昨天从中午开始我就纠结R语言的散点图。散点图这种东西,Excel里也能做,但问题是Excel里面没办法做出矩阵散点图。之所以我中午开始纠结R语言,因为我在几个月前到数据分析教程里知道学习里知道了R语言可以用几句非常简单的编程,绘制出神一般的的矩阵散点图。矩阵散点图这个东西,第一次看到就把我惊呆了。在那之前我见过的散点图只是两坐标或者三坐标上面标注点,绝大多数情况下我只看到过两坐标的。我们大都从点的分布,点的密度,点的聚集模式得出一些规律,找到一些结论。这是以前我一直在做的,我也只看到别人做到了那个程度,但在今年夏天我学习的那本数据分析里面,他们用两维数据作出一个散点图,在用第三维数据对比N个散点图。这些矩阵散点图是一次性做出来的,并不需要一个个的手动合并,而且那些散点图也不需要手工去设行列数。你只需要提出处理数据的要求,他们就会选择最佳的方式表达出来。第一次看到那个的时候,我觉得那简直是屌爆了!前几天我也尝试过用我的数据做矩阵散点图。后来发现,别说散点图,即便是要我提供一个能正确读取数据的csv文件好像也很麻烦。昨天中午,当我把一个一个Excel做出来的散点图罗列堆砌到Word里的时候,我明白到如果只是一两个,没问题,但我需要2个散点图一起做对比,4个散点图一并罗列出来找差异,显然只能使用矩阵散点图的方式,而不能一个一个贴浪费篇幅且让人疲劳。

在学习数据分析那本书的时候,虽然我也用过R语言,但是那纯粹是把书本上的命令行抄写过去,我完全没有动脑筋,所以当我把自己的数据放到R语言里面处理,希望得到我想要的东西的时候,无论我怎么纠结,貌似都得不出我想要的东西。在奋斗了几个小时以后,我才发现原来plot跟xyplot是两个完全不一样东西。plot是R语言的一个原生作图函数,xyplot则需要调用lattice数据包。数据包就像是一个插件,不过lattice那个插件已经常规到已经默认安装在R语言的主体软件里。在折腾的时候,我因为发现plot函数xyplot函数得出来的图不一样,我才明白到了这点。最明显的区别是他俩的图形颜色不一样,坐标轴的字体不一样,以及坐标轴的刻度分布不一样。我个人觉得lattice数据包作出来的图要比R语言原生的好看一些。

昨天我足足折腾了接近12个小时,才稍微得到了我想要的东西。之所以说稍微,是因为某些因素我还不能自如控制,有些参数我纯粹只是停留在猜想的层面。我不能满足自己只知道一些。我也知道有一些轻量级的作图软件大概也可以做到我想要的功能,但既然R语言如此强大,我愿意花更多的时间去认识他拥抱他。

用编程的方式去作图,想想都觉得这实在太牛逼了。于是,昨天晚上我也定下了目标,2020年我要加把劲学习R语言。

2019-07
16

看书自学,提升技能

By xrspook @ 8:58:29 归类于: 烂日记

第一次接触O’REILLY的head first系列的Java书本。已经不记得那本书我是从哪里买的了。当时我想学Java,网上的教程说那本书很不错,于是我就买回来了。不知道是那本书太高端了,还是我太低端,一开始的时候挺爽,但看着看着我就觉得自己跟不上那个进度。虽然我已经觉得自己非常努力,但是那些叫我动脑筋的练习题我几乎回答不出来。如果不看答案,那是想到天荒地老估计都得不出答案。看那本书需要具备相当优秀的逻辑水平,现在回想起来,那不过是用判断和循环不断搭配而已。在冥思苦想用Excel VBA出了一些小程序满足我的日常需要以后,现在倒过来看,觉得head,first那本书的Java题目,的确有难度,但却不至于让我落入到当年那种困苦的程度。当年因为觉得自己实在无药可救,所以我换了一本入门的书。因为第一本高端,换的那本低端一点,所以看第二本的时候我有种豁然开朗的感觉,前面的部分几乎可以一目十行地飞快前进。但到达一定程度,我就没看下去了,因为当时刚好碰上我换了份工作,所以很多时间需要用在重新上手上,我再没有那么多时间去继续自己的兴趣了。因为工作迫切需要我提升Excel技能。于是Java那本低端一点的书我没继续看下去,取而代之我开始Excel三剑客,它们分别是数据透视表,函数,以及VBA。

我首先看完的是数据透视表,函数看了一部分,VBA现在算是看完了。个人感觉数据透视表那本是我看得最酣畅淋漓的,我从中学到了很多,但具体你要我一个部分一个部分介绍,我说不出来,但是你给我份工作,我可以融会贯通。我买回来的那套书基于的是Excel 2013,当时我是用2003边看边实操,很多功能都做不到。现在我用的是Office 365,对应的版本应该是Excel 2019,2019和2013比起来,又多了一些高端的功能,从前那些只是试验性质的东西现在已经成为了2019的标配。在数据透视表方面,的确可以使用一些高端的功能了,但是要完成我的日常工作,通常来说,用2003的层次就可以了。接下来我看的那本是Excel的函数公式,这本书我只看的很少的一部分,因为我觉得与其说那本书是用来看的,不如说那本书是一本手册,是当你有困惑的时候去查阅的。因为里面的内容实在太多。普通人也不可能把所有函数的应用都了如指掌。对我来说,处理数据我最熟手的招数是数据透视表。函数部分有一些我知道它能实现某些功能,但具体要怎么折腾,需要试验一下。我觉得函数和数据透视表虽然有些东西二者都可以实现,但在数据汇总计算方面,数据透视表显然人性化很多。但是数据透视表很难进行数据进行提取,又或者把无序的东西归一。函数高手估计可以实现所有数据透视表的功能。如果把函数比作英语等级考试,估计能做到那个的人已经到达专八以上了,而对一般人来说,四级已经不容易。我觉得自己在函数方面,不过是中等的四级水平而已,而且是还没到可以参加口语考试的那种。之所以我没有非常努力地去学习函数,是因为暂时我还没有需要非常努力的动力。

还有很多东西很好玩,我想接触,我想学习。我觉得在外人眼里,貌似不成章法却能很好解决问题的,是最高的境界。那估计就是《笑傲江湖》里,独孤九剑的精髓——无招胜有招,但实际上那又不是真正的无招,因为招数已经和身体融为一体,到达了随心所欲的层次。

2016-05
11

开看java的head first

By xrspook @ 7:29:44 归类于: 烂日记

根据一贯的经验,越是到了检查日我就会越清闲,因为一整天就只是坐在那里,等检查人过来。检查就那么几分钟最多十几分钟,没有超过半小时的,但却要用一整个工作日等待。曾经试过,等了一整天,等到下班了还是没过来。最终,那一次他们真的没有过来检查,而我们却为此搞了3天的卫生。这到底是好事还是坏事?真说不准。

我的经验告诉我,检察日就一定是很闲很无聊的。检查之前还有点着急等待。检查之后那是完全的放松无压力。领导去招待那些来检查的人,而我的同事跟我一样,要不就是准他被检查,要不就是享受候检查后的快乐时光。

我抓紧这个机会,赶快拿本书出来学习一下,对上一次看程序语言的书已经不知道是什么时候的事了。大概那次是因为我为了要完成。工程原理的设计作业编写计算软件而去看VB。我最熟悉的程序语言是C语言,但那只是用来考试的。在实际应用中几乎不用。我觉得学会一种计算机语言,就像学会了英语一样,再学习其它语言,比如说,西班牙语,德语,法语,还有其他拉丁语系的语言的时候。不能说你有什么优势,但是某种法则起码你是懂了,所以你在学其它的时候会有一点感觉。HTML是我很久以前就接触到的,在我学C语言之前就已经懂了,之后我又学了CSS,还有PHP。说来也搞笑,之所以要学PHP是因为我要把WWE网站的图片正则出来,而无需我一个一个点开复制。大概所有程序员一开始之所以要创作是因为大家都很懒,大家都不想去干那些重复的事。

上周五开始,就没那么忙,所以我已经开始java的head first学习。程序类的书都老厚老厚的,这已经成了习惯。在买java这书以前我也买过一些很厚的其它程序语言的书籍,但在这之前书买回来我就只是放到书柜里,或者放在某个地方,只是买没有去看。在买之前我是花了很多时间去挑选,但最终,书和我是分离的,当然我就没有学到书里面的东西。而为什么这次居然会真的看起来而且是拿这个笔一边看一边做书里面的练习?是因为,我必须得学会这个语言,然后,我才能进一步学会写安卓程序。我的目标是自己写一个跨平台的数据录入及处理软件。之前也看过外国人写的程序书籍,但那些书是经典系列的,所以有些沉闷。而且因为我看的是翻译版本,翻译的错漏以及用词的生硬,简直让书本变得不堪入目。学习C语言和VB的时候,我用的是国人编写的教科书,感觉还行。这本head first我的感觉完全不一样,跟那些沉闷的,经典书籍,不同,里面的思路也跟国人编写的教材,有很大区别。主要是因为他们的脑洞发散得很厉害。他们经常把一些很沉闷的东西就像给小朋友讲故事一样,虚拟化拟人化或者各种萌化。里面用到的编程例子,s让你觉得,很折腾,很无语,但实际上是真的有助于你去思考。比如说简简单单的就只是三句话的输出,本来可以直接写出来,但是他们设计的练习,却让你不得不用各种条件判断,经过无数折腾后才弄出来。你需要明白其中的规律,你要好好的利用所有的规律。明明可以不折腾,但他们却非得让你折腾得要生要死。昨天最后一道练习题,我是在偷看答案的前提下才做出来的。做完以后我好好地想了几遍,但还是有点想不通,所以在10K的跑步里,我一边跑,一边想,最后终于想通了。这真是一本让人欲罢不能很想一直看下去的书。少有程序类的书籍会写得如此有趣。

越是学习越是想学习,因为越发明白自己无知。正因一直在奋斗的路上,所以生活也变得充实。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress