2020-03
26

py2脚本改写为py3

By xrspook @ 13:06:29 归类于: 烂日记

昨天,我在电脑上部署了Python3.8,令我意外的是BlogBus转WordPress的脚本居然可以在这个东西上一次通过。我在家里试的时候,如果安装现行的最新版本的Python,会有语法错误,为什么在单位这台电脑上就没有这个烦恼呢?

晚上我再去研究的时候,发现原来单位这台电脑在2017年就已经装过Python2.7。中午运行那个脚本的时候,估计不知道为什么那个东西自动调用了老的版本,所以没有发生语法错误。Python2跟Python3的语法差异很多人都中过招。习惯用Python2的人写Python3脚本肯定会有很多毛病。几天前当我在电脑上运行不通的时候,我的做法是卸载了Python3,重新安装Python2,这个做法是对的,是最快捷的解决方式,但是昨天晚上,我却选择了一个故意撞墙的方式——我要修改10年前的代码,让它在Python3上面正常运行。理论上,如果我在电脑上部署好了Python的环境,我应该可以在多种模式下正常运行那个东西。但实际上,当我很笨拙地在命令行运行那个东西的时候,的确可以,但是如果我用批处理文件调用运行,即便我在用户跟全局都都设置好了环境,依然运行失败。为什么会这样?我不知道,但显然很多人都遭遇过这种失败,所以网上的解决办法有很多,为什么这个运行环境,不是设置好了就万事大吉呢?我不太清楚。

在电脑上运行过Python以后,我觉得这个东西实在太神奇了。如果是其他语言,脚本与运行之间还有一个编译的过程,C语言是这样的,JAVA把貌似也得这样,但Python直接写完代码就可以运行。当然,运行失败的时候,他们会告诉你哪里出了问题。哪里出了问题跟有提示教你怎么改才对完全是两码事。我还在跟网友吐槽为什么设置好了环境还是批处理失败的时候,他建议我在VSCode里写py,同时也装上Python的插件。VSCode的Python插件有很多,要装哪个我完全不知道。因为VSCode是微软的产品,搜索出来的第一个Python插件也是微软昨的,至于那个东西有什么用,我实在不知道,我迷迷糊糊就安装了。在VSCode里编辑py的时候,会有一个在终端运行的选项,那里就可以看到运行效果。当我打开py文件的时候,右下角不断弹出叫我安装另外一个插件。一开始的时候我没有装,但是后来我还是装了,当然我也可以设置它不再提醒。我在装那个插件之前,我就在第1个插件的终端运行过一次py,有错误代码,跟我在CMD命令行显示错误代码是一样的。但是当我安装了第2个插件以后,奇迹的事情发生了。运行同样的脚本,在同样的位置依然会报错,但是下面还多了一行告诉我这个错误是什么,同时也会建议我应该怎么改。格式上的问题插件会直接告诉我要怎么改,比如Pyhon3在print的时候,要比2多写一对括号。另外一些状况属于插件无法确切地告诉你这个错误到底意味着什么,是哪里出问题了,但问题被描述得比较明白了。在见识过这些东西之后,我真心觉得,英语不好的人千万不要学编程,又或者说学编程,而且编得好的人,英语烂不到哪里去,因为他们看到的满眼都是那些鬼。如果你遇到一个喜欢用拼音缩写去命名函数写脚本的人,就我个人而言,我会非常怀疑他的技术。

之前让我觉得可能要折腾一个晚上才能搞定的脚本改写,在VSCode以及那两个插件的帮助之下,大概15分钟就搞定了,真的让人非常有成就感!

我不知道,我是不是天生是编程的料,但是一定程度上,我喜欢那些东西。我喜欢那些严格的逻辑,也喜欢那些在我印象之中或者意料之外的效果。

2020-03
25

框架在变

By xrspook @ 8:49:39 归类于: 烂日记

今天我突然觉得很崇拜我自己,为什么可以这么神,能做到自己想做到的事情,哪怕在那之前我完全不懂。我不知道这种自学能力是不是与生俱来的,还是一直以来的教育让我具备了这种能力且越发强大。对别人来说,我或许是一个每样事情都蜻蜓点水,没有深入进去的人,因为我的兴趣,真的变得好快,快到有时连我自己都措手不及。我尽量改正自己这个坏习惯。把一件事坚持不懈做下去效果会非常惊人。我觉得我的blog让我学会了坚持。只要做就好了,一开始的时候,我对自己的blog没有内容或者字数上的限制。所以一开始那几天我贴了不少图。因为当时用的是可视化编辑器,所以我完全没有想过这种事往后会让我的网页崩溃,因为自动带入了一些前端看某些情况下看不到实际又存在的东西。以前没有意识到,现在打开那些东西的时候,我自己都吓呆了。

从前之所以没有毛病,大概因为当时网页框架用的是table,但现在table这种东西几乎可以说已经极少用到了,起码对我来说是这样的,一整个网站写下来,我一句table都没用,但是用框架定位是非常正常的思路,尤其当从前的网页是用可视化编辑器整出来的时候,那样的话就保证了像我这样随便贴的人正文也不出错。我用过Frontpage,也用过Dreamweaver,但是Dreamweaver我用得很少,虽然我买过了相关纸质教程。Frontpage再怎么少,我也用那个做过一个大学选修课的作业。大概因为我交了个网页,有诚意,所以老师给了我个不错的分数。现在再去想从前的table会觉得,那太死板了。

跟从前比起来,现在看同一个网页,显示器的类型非常多。可能是用PC看,也可能也可能是用MAC看,绝大多数可能是在智能终端上看。不同手机的分辨率不一样,再加上各种型号牌子的平板,那就更加没办法算清。即便是PC的显示器,大小差异也很大。老掉牙的17寸以下仍然大有人在,也有人用的显示器堪比别人家的电视机。而且那种还真不像我妈那样,把小米电视当做显示器,方便率极低,那种超大型的显示器如果你在做网页的时候,还得考虑适配宽度分辨率,那就真的太难了。以前的主流显示器,大概都有一个范围,占有率前5加起来,估计能占到所有显示器比例的70%以上。在那种情况之下固定框架可以给出具体参数,但现在显然不能这么想了。如果屏幕小的话,你可能在那里显示的栏目只能是一栏,而且尽量要做到,再小的屏幕(非极限测试)也能放得下一栏,而不需要用滑动条左右移动。判断出读者是屏幕大的,可能你整个网页会分出很多栏。当然,会有一些主要区域用来吸引眼光,就像你去门户网站,看到满屏的路人甲广告一样。前段时间我发现了个网友的网站,小屏的时候,版头跟主体是上下结构的。如果遇到宽屏或者分辨率大于一定数值的时候,版面是左右结构的。我觉得这样的配置就很好了,但我也知道,这样清爽的网页没办法解决我这个要求太多的人。因为我总想把我要展示的东西塞在网页里。或许在我下一次blog模板修改的时候,我会把版面兼容性放在一个很重要的位置,比如说必须得考虑。

越是研究,越会知道自己想要什么,要怎么做到。别人或许有很现成的办法,但我总喜欢自己去亲身经历一下。

2020-03
24

回忆那只让我恐惧的小海龟

By xrspook @ 9:25:43 归类于: 烂日记

我不是读计算机的,但因为我是一个工科学生,所以我的大学课程里面有程序设计,但是学的是最基础的C语言。我不知道C语言跟其它比起来到底怎样,虽然很基础,但是该有的东西也都有了。还记得小学时学的那个小海龟LOGO语言。那才是真的一个让我崩溃的东西,每次上电脑课我都会有心惊胆战的感觉,大概因为当时我们是小学三年级,英语之停留在口语的阶段。如果只是拼打字,我还可以凭借那张纯粹打印出来的键盘练习。因为大家家里都没有电脑,所以所有人也就那个样了。至今我不觉得自己的打字有多快,尤其是如果你要我打英文。中文之所以快,是因为输入法有一些模糊音的处理,估计如果我是一个外国人,英语的输入法也有模糊音处理。英语输入法的模糊音或许只是我不知道。

小学的时光现在回想起来,就像奇迹一样。没有键盘的我们是怎么练打字呢?那些需要按Shift键才出得来的大写字母到底是怎么练的?我已经不记得一开始我们练习打字用的是哪个软件,但我记得我用过TT。现在我的电脑里仍然有TT这个奇迹般的软件。小学电脑室里学生的的电脑没有鼠标。之所以上电脑课用LOGO语言的时候我很慌,因为我觉得自己根本没有完全搞懂,处于一个半懂不懂的状态。那个东西回家却不能找爸妈帮忙。除了上课那40分钟以外,就再没有上机的机会了。我没办法通过课外练习弥补我课堂上的困惑。又或者那个时候,如果我努力的钻研一下课本,我不会迷糊,但如果我有一个实操的电脑摸索,我一定会觉得那相当简单。小学上电脑课的时候都是两个同学一台电脑。我的同桌总觉得那个小海龟非常简单,于是老师讲课的时候,他总是在脑洞大开的各种探索,当时的电脑还没有中央控制全部这种高端的功能,所以老师根本不知道,学生在下面瞎搞。也大概因为这样,我的注意力就好在看他脑洞大开上面,因此忽略了老师。之所以同桌觉得那超简单,因为他家里有电脑。对我来说,小学的记忆中,电脑是个恐怖的存在。那门课对我来说比其它课程都要让我忐忑,但当时所有人都意识到,电脑将是未来需要掌握的基础技能,不懂电脑跟文盲没啥区别。

初中的时候,我家里终于有了电脑,那是一台别人淘汰的机子。虽然说是被淘汰的,但是没被淘汰之前,又或者新买回来的时候那东西很贵。小学时候,学校的机房学生用386,没有鼠标,只有老师的那台486才有鼠标,下课的时候我们会围看老师玩纸牌。所以当亲戚的那台旧电脑搬到我家的时候。我根本不知道如何用Windows系统。连怎么关机我都不会。鼠标单击双击左键右键是个迷之存在。虽然,亲戚的朋友把机装好以后,给我演示了一下要怎么操作,但实际上我只是迷迷糊糊似懂非懂,关个机费了九牛二虎之力。小学时的LOGO语言没学好,因为我没看书,家里也没电脑,当我家里有了电脑以后,我买了一些Windows操作系统的书,也看过一些Windows和Office类的教学光盘,于是,我终于不慌了。虽然那个DOS系统还是会让我莫名紧张,但看到Windows界面就会觉得安稳。

又过了好多年。电脑这东西几乎变成了老古董,现在大家用得最多的是各种智能设备。虽然样式在变化,但实际上最核心的东西仍然不变,无论是从前小学里我们用386的时候,还是现在的各种智能终端上的AI系统,核心的东西依然是编程算法。

冥冥之中,我总是要跟一些我早年害怕的东西打交道。大概战胜自己就是活着的意义。

2020-03
23

选择我的语言

By xrspook @ 10:34:20 归类于: 烂日记

现在我到底比10年前进步了多少,我不知道,但显然,10年前我还不认识正则这种东西。后来的很多抓取需要让我不得不学习了这个。一开始,我是在PHP上面用的,而昨天,我要把这个用在Notepad++上面,正则类似,但不同地方的细则又有所不同。正则这个东西让我在Notepad++上完成了我觉得这软件可能完成不了的事情。我太低估Notepad++的实力了!简单的替换或者新增这段,对它来说毫无压力,尤其是纯粹字段的东西。昨天之前我有想过要不要这次之后我也学习一下Python。语言类的东西学习了不少,但是我的电脑里没有配置一个环境可以让某个语言做到输入输出文件。如果把Excel算上,估计那是唯一OK的。我之前用的PHP实际上在编程方面我几乎没接触过。

学习编程语言,学习什么样的编程语言,很多时候都不是由我自己说了算。遇到什么问题,看到别人用什么解决,然后我就会觉得那个东西很有用。如果现在要用一种语言去定义我自己的话,我甚至说不出来。我不需要所有语言都懂,我只需要有一个我非常懂的东西就可以了。但显然,现在我还没做到,所以接下来我需要做的是找到这种语言,然后深入的研究。无论哪种语言,深入进去以后都可以无比强大,起码我想实现的那些小愿望全部不成问题了。其实我也不能说我完全不懂PHP,我还是有点懂的,但主要还是用在一些前端方面。因为我会认识这种语言是从网页与CSS配合开始的。一直以来,我都没有深入进去。我没有在电脑上长期安装一个运行环境。每次我要测试开发WordPress模板又或者其它内容的时候,我也是到需要时才安装,不需要的时候又把它卸载掉。需要PHP的运行环境,意味着可以实现很多计算,但我并不需要一定在本地部署。我把脚本放在网上一个免费的地方,我那些小不点功能其实就可以做到。以前,我是这么干的。现在估计我依然可以这么干。我为什么要配置PHP环境而不配置其他东西呢?其他东西可能更方便快捷。我不知道语言与语言之间的差异主要有哪些。从宏观层面上看,判断和循环基本就是它们的全部,但在如何表达参数上面,各家有各家的说法,所以其实一直以来我都很蒙圈。如果你给我一堆代码,要我判断这是哪种语言的。我肯定说不上,除非有一些非常明显的标志。看看他们的声明以及执行部分,很多时候我觉得都一个样。当然这只是我肤浅的觉得,实际上不是这么回事。因为我不熟悉他们,我只是见过他们,有些更加纯粹是一面之缘。

就像我用一个数据透视表能解决几乎Excel的绝大多数问题一样,因为我熟悉它。如果我熟悉公式,我也一样可以单用公式解决Excel的绝大多数问题。我是时候在一种编程语言上下功夫了。

2020-03
22

折腾不同版本的WXR

By xrspook @ 22:09:44 归类于: 烂日记

我只是想把自己从前的东西重新拿出来,原来这也会很难,这是我完全没想到的。要找回那些尘封10年的文档,并不算太难,翻一下电脑也就找到了,虽然有点坎坷,因为当时备份的时候,我没有标注是哪个网站的,xml都放在一起,我以为那都是我主站的,后来,同一个日期不同的文件大小才让我觉得有蹊跷。xml文档找到了,接着要把它转化为WordPress的格式。当年用来转换文档的脚本找不到了,翻遍家里电脑的各个盘都没找到。之所以在家的电脑找不到,是因为当时干这事我是在单位完成的。所以理论上单位的电脑应该有,但是因为换过电脑,我也清理过同步盘,所以会不会也因此清理掉呢?这个我不确定。我觉得,在我转格式的时候,我仍然在用Dropbox,里面的很多东西我的确已经清理了,于是这也很好解释,为什么我家里电脑的Dropbox文件夹里找不到那个脚本。家里的电脑没有,单位的电脑可能有,但还有一种可能性,我把那上传到网盘,于是就把那同步软件里撤掉了。我只会上传到两个地方,一个是百度,一个是115。115打开很麻烦,我也懒得下载打开它的工具。百度上果然就有我要找的东西,但当我想把整个文件夹下载回来的时候,问题严重了,那里居然有4000多个文件。下大文件的时候度娘就很慢,下小文件的时候度量更慢,那是直接10KB以下的速度。我直接去网页版的度娘找到我要的东西,不在客户端里等它慢慢下载了。

东西下载回来以后,我再翻查我的日志,我需要安装一个Python。我默认安装的是现在最新的版本3.7.7,但运行脚本以后却发现才刚刚开始读取脚本,就马上报错。查找原因,原来是版本之间的语法差异。才刚刚开始就错,要运行完整个脚本,我真不知道还得修改我根本不懂的语法。所以,我把最新的Python卸载掉了,重新安装当时我就在那个版本下转换的2.6.5。2.6.5是一个什么概念?这意味着时光倒流10年。

出乎我意料,软件装好以后,我几乎没遇到困难就可以把BlogBus的文档成功转为了WordPress的格式。在下载Python的时候,我顺便下载了XAMPP,同样下载的是最新的版本。前段时间我才刚用过,觉得挺爽。我也下载了最新版的WordPress的5.3.2。同时把导入插件也装。当我试图上传,已经转过格式的xml是,上传报错。原来这才是噩梦的开始!不同版本的WordPress里的xml格式各不相同,几乎可以这么说,越往后越严格越来越严格了。于是我又安装了WordPress 3.9和2.8。3.9的WordPress在PHP 7之下马马虎虎可以运行,2.8是直接连数据库都连不上…… 于是我甚至不能从通过低版本的WordPress N轮导入导出拯救世界……

没办法,我只能研究我手头上的xml,看看和现在的标准版差多少。首先,必备填写一个WXR的版本号。在旧版本里,这条规则是这是不存在的,所以要手动加入。同样需要手动加入的就是,即文件类型,因为现在的WordPress把文章分成了post和page。把这些搞定以后,基本上正文就可以导进去了,但是分类和标签还是不行。因为现在的分类和标签,WordPress使用的是一个叫做nice name的东西,你必须在分类和标签那里,加上这个标注0才能识别的出来。评论那里,当年就试过在2.8的版本里面评论正常,但是在2.9里面,有评论的话会只剩下一条评论。研究发现,那是因为评论有了一个id号。BlogBus转码过来的东西没有id号,所以大概东西就自动覆盖了。除了这些BlogBus和WordPress之间的格式问题以外。我的文章里还有格式的=问题,因为有些东西,不完全是我自己的东西,好些是我从网络上搜集回来的。当时我保存了网页,在BlogBus发布的时候直接复制到可视化编辑器,所以格式也带入了。如果当时我懂得先把东西贴到记事本,然后再剪切粘贴一次,就不会存在这种问题。除了格式以外,从前的blog里还有图片,但经过这么多年,图片都已经失效了,链接摆在那里只会浪费加载时间和访客的期待,所以我要把图片链接也尽可能去掉。有些图片链接是我没办法去掉的,因为用正则筛选的时候会遇到一些很屌丝的句子,到了某个点,就卡住了,但实际上那并不是这个标签的结束。

搞清那些规则,总结出我的对策。一次又一次查找替换,一次又一次导入删除再导入。花了一整个下午加半个晚上的时间,我总算搞定了从前BlogBus上的BLF!文章238篇齐全,评论56条也齐全!!!其中可能会有一些小格式上毛病,但是那并不是共性的问题,后续还得靠运气慢慢修改。

非常有必要记录一下我在Notepad++上做的WordPress不同版本xml转换操作

/*操作开始*/

普通替换《channel》为《channel》《wp:wxr_version》1.1《/wp:wxr_version》 /*WP XML共性问题*/
普通替换《category domain=”category”》为《category domain=”tag”》
普通替换《dc:creator》《/dc:creator》
为《dc:creator》《![CDATA[xrspook]]》《/dc:creator》《wp:post_type》《![CDATA[post]]》《/wp:post_type》《category domain=”category”》《![CDATA[回到过去——Betty迷的独白]]》《/category》 /*《/wp:post_type》前是WP XML共性问题*/
普通替换《BR》《BR》为《BR》
普通替换《!–msnavigation–》为无
普通替换[summary_of_BLF]为[summary_of_BLF(from_rincondebetty)]
普通替换[summary_of_EcoModa]为[summary_of_EcoModa(from_rincondebetty)]
普通替换《category domain=”tag”》《![CDATA[(from_rincondebetty)]]》《/category》为无
普通替换[Yo soy Betty, la Fea]为[Yo_soy_Betty,_la_fea]
普通替换[JEA’s Writting]为[JEA’s_Writting]
普通替换”博主”为”xrspook”
普通替换《i》为无
普通替换《/i》为无

正则替换category\”》《\!\[CDATA\[(.*?)\]为category\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换tag\”》《\!\[CDATA\[(.*?)\]为post_tag\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换《[TDSFHI].*?》为无
正则替换《/[TDSFHI].*?》为无
正则替换《P.*?》为《P》
正则替换《(table|tbody|tr|td|div|span|img|script|font|hr).*?》为无
正则替换《/(table|tbody|tr|td|div|span|img|script|font).*?》为无

《wp:comment》《/wp:comment》中增加《wp:comment_id》1《/wp:comment_id》,id数字递增 /*WP XML共性问题*/

/*操作结束*/

注:请自行替换《》为<>,用尖括号那是全部都挂掉无法显示的节奏啊啊啊

这个是一次死去活来的经历啊啊啊啊啊啊啊啊啊啊啊啊!奇怪的知识又增长了不少……

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress