从收集数据开始
在大数据的年代,对大公司来说,收集信息不是难事,怎么把信息经过一番折腾以后,变成他们所要的信息,指导他们的宣传、生产,甚至是发展方向才是目的。但是对一些小公司而言,把最基础的数据收集完全也不容易。之所以这样,是因为他们很多都没有感知到数据的重要性。对很多人来说,工作只是一个应付的行为。应付领导布置下来的任务。做完已经已经很了不起,更不用说你不可能奢望他可以在那基础的上发展些什么。因为这样的态度,所以仅仅收集好任务要求的那些数据对他们来说已经完成任务。他们不会帮你思考实际上还有哪些东西是需要收集整合的。就因为这样,我们经常会错过很多。
我觉得,在大数据的年代重要的并不是具体某一条数据所包含的信息,要把无数条真实的数据放在一起才能得出某些结论。首先,这些数据必须是真实的,而且这些数据的维度必须一致或者类似。如果数据的详细程度不足够,就得通过某些技术手段把数据整合起来。有可能那条数据代表某一个人,又或者那代表某一个工序。我觉得大数据的这种东西除了要求数据的数量够多,也要求每一条数据反映的维度够多。
昨天在和新招回来的小妹妹聊天的过程中我发现,原来她大学所学的金融学和会计学这两个专业跟我所读的食品科学与工程.在毕业论文这个问题上,差别非常大。因为我们完成毕业论文的前提是必须完成毕业实验,然后我们才可以根据那个数据写我们的东西。而她的论文,据说数据完全是通过收集回来的,她自己都觉得不太完整,但她已经尽力了。她要分析搜集回来数据背后的某些规律和原理,而我们要一开始就做好规划,首先设定我们的目标,然后设定如何验证那个结果,最后通过我们的实验发现一些规律,得出一些结论。非常有可能最终我们都没办法把那个毕业实验的东西提升到理论的层次。因为要做到那个的话,有些人可能研究一辈子都做不到,更何况我们只有区区一年的时间。但相对他们而言,我们经历的显然要更完整一些。对我们来说,从一开始我们就必须知道,我们要收集什么数据,以及为什么要收集那些,但是对他们来说,很多数据都是现成拿过来的,他们只能做减法,没办法做加法,但对我们来说却不一样。有可能在设计的时候,老师就觉得这样不完备,我们可以增加一些条件之类的东西,又或者在我们实验的过程中,我们要根据实际情况进行数据收集的调整。从表面上说,我们的论文貌似复杂麻烦一点,但实际上我们的内容更自由。我受过的教育让我觉得白手起家没什么,那些对别人来说是额外麻烦事的东西对我们来说再正常不过了。大概因为这样,所以要一个理工科生去解决某些貌似不是这个专业的问题的时候,会收到神奇的效果。
大概是命中注定,高考的那一次我达不到平时的水平,于是没有去广外,而是去了华农。
还没有评论