说时迟,那时快,今天下午终于解决了困扰我2天的问题——flash内嵌网站的元素提取。
昨天装上了强大的Sothink SWF Decompiler,可以把.swf里的元素抽丝剥茧出来。这解决了问题的一般大半,但怎么才能下载全部.swf文件呢?那些全flash网站网址只有一个,无论里面的内容跳得如何,嗅探工具、代码搜索工具都只能捕捉到一个最基本的。这是不可能的,有多个页面,网址只有一个?肯定是主.swf里嵌套了其它.swf,而那些东西又躲了起来,不直接在网页源代码里表现,岂有此理!
今天用了个最笨,但最有效的方法来提取里面的.swf。IE-属性-浏览历史记录-设置-查看文件(打开C:\Documents and Settings\用户名\Local Settings\Temporary Internet Files即传说中的IE缓存文件夹),有点美中不足的是我在Firefox中不能进行相类似的操作,亏我还是FF的粉丝啊!编辑-全选-(Shift+Delete)删除全部文件-刷新你打开的全flash网站,如:http://www.jorgeenriqueabello.com/,然后正常浏览,每打开一个页面刷新一下那个文件夹,你会发现会多出些.swf,那些就是你曾经很想要,但却一直得不到的每个页面的.swf,之后用Sothink SWF Decompiler搞一搞,想怎么提取就怎么提取,随心所欲无所不能!
当然啦,我这些不懂flash菜鸟才会用这个方法。刚才我又研究了主.swf文件中的Action,其中有个叫做sprite 61(与sprite有关,与后面的号数无关,大家随机应变啦)的物体是这样写的:
// Action script…
// [Action in Frame 1]
stop ();
unloadMovieNum(10);
unloadMovieNum(20);
unloadMovieNum(30);
unloadMovieNum(40);
unloadMovieNum(50);
// [Action in Frame 2]
stop ();
loadMovieNum("G8_HojadeVida.swf", 10);
unloadMovieNum(20);
unloadMovieNum(30);
unloadMovieNum(40);
unloadMovieNum(50);
// [Action in Frame 3]
stop ();
loadMovieNum("G8_Fotos.swf", 20);
unloadMovieNum(10);
unloadMovieNum(30);
unloadMovieNum(40);
unloadMovieNum(50);
// [Action in Frame 4]
stop ();
loadMovieNum("O8_Publicaciones.swf", 30);
unloadMovieNum(10);
unloadMovieNum(20);
unloadMovieNum(40);
unloadMovieNum(50);
// [Action in Frame 5]
stop ();
getURL("http://www.jorgeenriqueabello.com/contacto/contacto.asp", "_self");
// [Action in Frame 6]
stop ();
loadMovieNum("O8_Prensa.swf", 50);
unloadMovieNum(10);
unloadMovieNum(20);
unloadMovieNum(30);
unloadMovieNum(40);
太伟大了,我所要找的.swf就藏在那里。虽然,Reelart是个为特殊人群设计网页的专业公司,但他们对作品的保护还没到我所害怕的那个程度。不会让菜鸟在页面源代码里找到嵌套的.swf,但却在一些技术稍高一点的菜鸟的手中资源还是无所遁形。于是,全flash网站:http://www.jorgeenriqueabello.com/简而言之就能分解为一下几个分.swf文件:
http://www.jorgeenriqueabello.com/L8_Inicio.swf(这个完全没难度,只要你有瞄过页面源代码)
http://www.jorgeenriqueabello.com/G8_HojadeVida.swf(对应curriculum)
http://www.jorgeenriqueabello.com/G8_Fotos.swf(对应fotos)
http://www.jorgeenriqueabello.com/O8_Publicaciones.swf(对应publicationes)
http://www.jorgeenriqueabello.com/O8_Prensa.swf(对应prensa)
http://www.jorgeenriqueabello.com/contacto/contacto.asp(对应contacto)
其中http://www.jorgeenriqueabello.com/O8_Prensa.swf(prensa)又嵌套了个.flv文件:
http://www.jorgeenriqueabello.com/PRENSAJEA.flv(一个十分精彩的PPT简介式图片介绍)
http://www.jorgeenriqueabello.com/O8_Publicaciones.swf(publicationes)又引用了几个.pdf文件:
http://www.jorgeenriqueabello.com/breveHistoria.pdf(BREVE HISTORIA DE LA GUERRA Los recuerdos, eso es lo que matan las balas)
http://www.jorgeenriqueabello.com/yopecador.pdf(YO, PECADOR Quién soy, sin crisis de identidad)
http://www.jorgeenriqueabello.com/FelizanoMrOrwell.pdf(FELIZ AÑO MR. ORWELL20 años después de la pesadilla)
http://www.jorgeenriqueabello.com/serNoser.pdf(SER O NO SER… PERO SIN SUDADERA Hip hop para unos, pero, ?para todos?)
http://www.jorgeenriqueabello.com/yPerdonaPorTut.pdf(…Y PERDONA POR LO DEL TUTEO Schumascher puede ser muy campeón,pero es detestable)
http://www.jorgeenriqueabello.com/cartaNY_JEA.pdf(¿La Estatua de la Libertad, por favor?)
到此为止,终于把现在我所能看到的http://www.jorgeenriqueabello.com/玩转。提取到我需要的图片,拿到我需要的文字,呵呵呵呵,不是一般的爽!我爽了,做网站的可能会被我气疯了,嘻嘻:)))))))