2010-11
16

激情与神经病

By xrspook @ 23:30:47 归类于: 烂日记

昨天19977里有人提出图片区可否增加TNA的官图,其实如果TNA不是BT的话,贴与不贴只是个习惯的问题,但是TNA的图片很BT,右键还不能保存的那种。

首先Photo Galleries使用的是近似框架形式的大概js手段,按链接是看不到网址改变的,不过,我的癖好是“在新标签页中打开”,打开后,网址又见变化了。这是第一个手段,算是很一般。

然后,重头戏,TNA的图片全部采用.php保护,所有图片的格式都被强制变成了***.jpg.php,Firefox下右键还不能保存到图片,保护严密。还记得之前2次PPV都把我害得几近手抽筋。

TNA的图片页面很是邪恶,但它给出了订阅按钮,也就是说页面是标准rss化的。rss意味着什么?rss就意味着XML,而且它的rss还是全部输出的类型,一页的rss就能输出整个系列的全部内容。刚刚熟悉了XML的格式化和信息提取,再次让我碰上新朋友,无比的兴奋。经过不太折腾的尝试后,也居然把从前的大敌TNA的图片给扯下马来了。内牛满面。

再次炫耀一下(WWE + TNA):http://xyark.serw5.com/

今天发现20101115RAW某些页面居然无法输出,研究了一个晚上,SH最后终于得出结论!title信息里有个“&”,格式化XML时受阻,因为“&”这东西太敏感了,是不允许当作“and”的意思出现的,所以会出现输出中断。解决办法如下:

/*$data = str_replace(“\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\t\r\n\r\n\r\n\t\r\n\r\n\r\n\t\r\n\r\n\r\n\r\n< ?xml version=\”1.0\” encoding=\”UTF-8\”?>”, “< ?xml version=\”1.0\” encoding=\”UTF-8\”?>”, $data); 注:第一个版本的YARK是不是很笨,呵呵呵*/
$data = str_replace(“\r\n”, “”, $data);
$data = str_replace(“\t”, “”, $data);
$data = str_replace(“&”, “&amp;”, $data);
// $data = str_replace(“&”, “囧”, $data); 注:对付“&”的一个“好”方法,先囧来
$data = XML_unserialize($data);
// $data = str_replace(“囧”, “&”, $data); 注:对付“&”的一个“好”方法,再囧去

感觉自己处于见人杀人,见鬼抓鬼的状态。这就是激情了,不过正因为这些变态的激情,让我神经病了。昨晚凌晨1点多才上床睡觉,还兴奋得睡不着。今天,也已经不早了,我还在写。

Pasion make me crazy, good or not?

2010-11
13

YOU ALREADY KNOW THAT

By xrspook @ 22:51:02 归类于: 烂日记

终于在SH的提醒和帮助下,在已经注册的几个国外免费空间里正常运行起YOU ALREADY KNOW THAT,我见简称YARK,按照首字母缩写应该是YAKT的,但误打误撞,变成YARK了,呵呵,YARK太短,所以注册的二级域名前加了我的戳“X”。正如YARK里的《h1》内容所标示:如果你是我的同伙,你会知道那空荡荡的网页是什么,怎么用;如果你想在这篇日志里直接找到答案,很对不起,在不跳转继续阅读某些链接的前提下,不可能。又或许,你真的很想知道,email我吧。至于我的联系方式,细心的你肯定already know that。

闪亮亮地放出一个YARK的地址:http://xyark.serw5.com/

很高兴地告诉大家,今天的YARK又实现了一个新的功能——直接把页面的title也输出了(并非各自的小title)!哇咔咔,如此一来,可以利用从RSS读到的地址完成某事,再也不用手动敲打某些代码了!

想变得懒惰欲望让我变得勤快。先花费一些时间制定规则,之后就可以拯救一些人的很多时间了。这就是程序的力量!!!!什么规范化管理,什么质量管理,如果你是个程序员,那些道理you already know that了。

说回YARK昨天没成功下海,原因是我完全是个PHP小白,所以碰得一头灰。通常,服务器基于安全考虑PHP的allow_url_fopen选项默认是OFF状态,免费空间通常都只会是OFF。而在PHP中需要使用file()[又或者file_get_contents()]函数获取其它站点的数据时,中招了,OFF状态就会出现一个“Warning: file() [function.file]: URL file-access is disabled in the server configuration in ***”的错误。幸好,我们还有第二招,cURL。在PHP程序里加入一段curl就能解决问题,但,这也是有前提是,curl是PHP的一个扩展库,所以,你的PHP系统的这个扩展功能必须处于enable状态,有些免费空间里curl是处于禁止状态的,那囧啊,不过确实存在,远在天边近在眼前的例子就是默认状态下的XAMPP。

也不管行不行了,把curl代码加进去试试再说,代码引用如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
< ?php
/*
* @return string
* @param string $url
* @desc Return string content from a remote file
* @author Luiz Miguel Axcar (lmaxcar@yahoo.com.br)
*/
 
function get_content($url)
{
	$ch = curl_init();
	curl_setopt ($ch, CURLOPT_URL, $url);
	curl_setopt ($ch, CURLOPT_HEADER, 0);
	ob_start();
	curl_exec ($ch);
	curl_close ($ch);
	$string = ob_get_contents();
	ob_end_clean();
	return $string;
}
 
#usage:
$content = get_content ("http://www.php.net");
var_dump ($content);
?>

实际应用时把http://example.com代替http://www.php.net作为数据输入,然后网址会经过function get_content($url)处理,进去的是一个网址,出来的是一个对网址所代表的网页信息进行处理后的字符串,也就是说,$content是一个包含所有网页信息的字符串,你喜欢怎么折腾就怎么折腾好了。至于那句“var_dump ($content);”是把$content的内容输出打印出来,你或许不会用到。不知为什么可以这么神奇,但就是这么神奇。PHP默认设置下不能实现的功能通过cURL就能实现,但实际上,最终效果是一样的。

再次感谢SH童鞋,也感谢那位写cURL挽救世人的巴西童鞋,是广大程序员让我感觉我是站在巨人肩膀上的。

也愿YARK能在它的用途上发光发亮。

2010-11
12

无处安家

By xrspook @ 23:53:14 归类于: 烂日记

花了一个早上注册了接近10个国外支持PHP的免费空间,无一例外,都不支持我的小转换程序,泪流满面啊~~~~ 基本上都是不允许file access,巨囧。不就是借php处理一下文件而已嘛,导入XML输出XHTML,仅此而已。不是大奸大恶,却落得如此下场。有些空间是不支持的,有些空间是不知道该怎么用的,么法语、俄语、匈牙利语,按G翻译都按到手软,到头来还是不知从哪里下手。不得不说,郁闷到极点的时候,我怀念我的英语和西语啊~~~ 西语从来都没有让我如此彷徨过。

完全不知道该怎么办了,难道要把程序一直挂在我自己的地方?其实呢,也无伤大雅,因为从页面和页面源代码你啥都看不出来。因为核心php部分都经浏览器处理了。机密,也不能算机密啦,不可能漏出来。光看这个网页,没人能看出这是干嘛的,除非你是高手,你故意探我的php,但如果你是高手,自己就写php了,根本不用来探我。

真没想到,想找个支持的免费空间也这么难。

Warning: file() [function.file]: URL file-access is disabled in the server configuration in /***/index.php on line 20

这句话让我揪心不已。

初出茅庐的小php只好到窝在家里坐井观天了。

2010-11
11

光棍网页

By xrspook @ 23:59:08 归类于: 烂日记

光棍节的今天,很认真地写起了程序。

程序是干嘛的?

是个简单的转换程序,贴图用的,更准确地说,盗链WWE官图用的。之前已经详细说明WWE官图的获得及引用法,但那样做太笨了,Excel是很伟大,但要人手做那种简单但无聊操作,是种浪费。很规矩的外国人,很规矩的WWE网络工程师们做了很规矩的view.xml页面,我们为什么就不能利用一下这些很规矩、直接输出我们想要的呢?

整个下午和半个晚上就在折腾这事,期间非常感谢SH童鞋的鼎力支持!!!!!!

又在瞎蒙PHP和XML上前进一大步了!想当年,我的XHTML和CSS就是这般误打误撞蒙出来的。

XAMPP的单机测试已经成功通过,但手头上的免费空间有这样那样的限制,无法测试,而自己的付费空间呢,也有一点待解决的小问题,所以,有需要的同志请耐心等待。暂时还没通过挂在网上的实战演练。不过,战绩是必须大大地展示的。嘿嘿嘿,虽然我小通CSS,但不打算精细修理网页了,还是让这东西原汁原味吧,太多的修饰会成负累的。

光棍网页一个,但却能强劲地发热发光!

2010-01
10

BlogBus到WordPress镜像小记

By xrspook @ 20:00:08 归类于: 烂日记

紧急告知该方法不能用于WordPress 2.9.1,会出现每篇文章的评论丢失(如果某篇文章有评论且有多条,只会剩下一条),强烈建议使用2.8.*(我用的是2.8.6),可以用2.8.* 的做WP导入再升级到2.9.*!!!!

坐在电脑前折腾了一个下午的WordPress,但我最希望的还是BlogBus能回归。

金窝银窝,还不如自家的狗窝。

今天在G老师的帮助下找到了几个文章,终于把非标准的BlogBus .xml导出数据转变为标准的WordPress eXtended RSS (WXR) .xml,然后又在yo2老大oneoo设计的DivXml.exe帮助下把转换成功的文件分割为小块。

具体操作嘛,很简单,分享一下前辈们的好东西。

感谢ant21Daniel阿七!!!

用的是Python转换法,程序是用Daniel的(下载:bus2wp_modified),因为他说已经解决了BlogBus到WordPress的分类及标签问题。至于方法嘛,原创是ant21的,但阿七说得更具体,如下:

1.在BlogBus的后台导出日志,保存XML文档。具体方法:进入BlogBus后台,博客>博客设置>导入导出>导出日志>保存为XML格式,假定保存的名字为bus.xml。放在D盘根目录,即D:\bus.xml。

2. 下载python以及bus2wp.zip。python的下载地址是:http://www.python.org/ftp/python/2.5.1/python-2.5.1.msi(我已经在用2.6版本了),bus2wp_modified。下载python后,安装,解压下载的bus2wp_modified到D盘根目录,即D:\bus2wp.py。

3. 点击开始菜单>运行>输入cmd,回车进入Windows的命令行窗口>输入d:,回车,转到D盘目录下。输入bus2wp.py bus.xml wp.xml,回车,等待转换…>如果没有出错,就成功了!如果提示出错,检查导出的bus.xml,发现并解决问题(会提示是哪行哪列出错的)!建议用Notepad++进行检修,毕竟用系统自带的记事本实在太简陋。xrspook在转换过程中就出现过问题,不知道为什么代码里有些很诡异的“sub”,每次都会卡死。

4. 登录安装好的WordPress后台,导入日志。具体方法:管理>导入>选择“WordPress”,从WordPress导出文件中导入日志、评论、自定义字段、页面和分类。选择导入文件D:\wp.xml,导入>选择导入后日志所属作者,确定导入(可选上导入附件)。成功!

下图就是xrspook转换过程中的坎坷,修改多次才成功啊!转换共用66秒。原BlogBus的.xml大小为11.1MB,转换成WP型后减肥了,只有8.87MB。原先的.xml不能用DivXml.exe切分,但转换后的就可以了,呵呵,再次谢谢oneoo。


单机是用xampp搭建的php,而强大的它允许上传的WXR能达到128MB,所以切不切分无所谓,但是转换时间较长,我可有接近2300篇历史记录啊!但如果用在线上服务器不切分基本是不行的,所以测试不切无所谓,动真格的时候就得切了。

导入部分切分后的文件你就会发现虽然数据从BlogBus全部转化为WordPress了的,但还是有点瑕疵。我暂时发现的是:在评论的回复中,BlogBus把客人的留言和blog主的回复都放到<CommentText></CommentText>里,而且都是显示为“博主 对 ** 的回复:****-**-** **:**:**(后面那个为日期及时间)”。“博主”这个好不刺眼,于是我就全部重新替换为“xrspook”了,否则,真的让人很头大。不知道WordPress的导出数据是如何区分留言者和回复者呢,应该不会像BlogBus这般囫囵吞枣吧,毕竟WP是支持多层回复的,不像BlogBus那样只局限于blog主人对客人的回应。

如释重负般完成了WP模板的初步修改和历史数据导入。

但说到底,这还不是我从前大家所熟知的老家啊!

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress