2021-05
19

终于有了BLF的官方字幕

By xrspook @ 9:49:52 归类于: 烂日记

NBC到底有没有外挂字幕,从我的观察看来是有的,而且那个外挂字幕好像是西班牙语(虽然他们写的是英语,骗谁呢!),但是怎么下载呢?用什么工具下载呢?能在线下载NBC的网站上去很少,就更加不用说下载NBC字幕的了,既然youtube-dl可以下载NBC的视频,为什么就不能下载它的字幕呢?为了这个东西,我研究了一番要怎么在youtube-dl上下载字幕。理论上视频和字幕可以分开下载,但现在人们的新玩法是下载视频的同时,而且把本来是外挂的字幕内嵌到视频里,这个想法很新颖,这样就可以一次性做完两件事了,但我感觉这种内嵌估计不是硬压,因为如果硬压的话,会需要比较多的时间。下载视频如果网速不好非常的耗时间,但下载字幕就只是个文本,相当简单的一件事。

对我来说,youtube-dl其实最大的障碍是不能直接使用,怎么才能使用呢?这又花了我一点时间。某个东西的技术我又不是很成熟,不确定一定可以,所以翻来覆去搞不清是下载不了字幕,还是说在下载之前的某个步骤做得不好。

最终我的确做到了下载NBC上面的BLF官方西班牙语tt字幕。tt字幕(全称SMPTE-TT,tt是它的文件后缀)是一个XML结构的东西,看上去很像网页文件,它的结构也的确跟网页文件没什么区别。也不管到底这个是什么东西,反正能下载回来,肯定有转换的方式,一开始我想到的是用Subtitle Edit, 结果发现我存的那个软件太久远,所以要使用那个软件的话,需要我装Net Framework 3.5,对老电脑来说,那显然是要安装的,但是对win10来说,这个是不一定安装的存在,我担心安装了这个东西会影响到我的office,因为office的power系列功能很大程度都依赖这个net framework,我一直都用的好好的,如果装了个低版本的导致我出状况,那就真的很郁闷了。所以我尝试过用其它字幕软件,接着发现我最常用的那个Aegisub不行。怎么才可以把tt文件转化为很大路的srt呢?其实当我看到那个tt文件的时候,我就意识到用普通的srt不能解决问题,因为字幕是西班牙语的,有非常多的特殊字符,必须用UTF-8才能解决问题,而srt字幕通常对应的是用ANSI。所以其实转换为ass文件会更好。不知道为什么,网上到处都是vtt或者webtt字幕,却几乎没有tt字幕。 vtt字幕是油管自带的,而webtt字幕是HTML5视频里面很流行的字幕。这两种字幕都可以在网上直接找到转换的地方,但是tt却不行。

纠结了一大轮以后,我甚至有想过要自己写python脚本转换。正在这个时候,网友给我发来好消息,他的Subtitle Edit可以转换这个字幕。之所以我的那个不行,是因为我不想安装框架,无法打开软件。我赶紧又下了一个最新版本的Subtitle Edit,非常快速高效地就把我想要的东西转换了出来了,但是,总感觉转换出来的时间轴怪怪的,tt格式的字幕的毫秒设定到底是什么规则呢?他们的时间表达居然是“00:00:00:00”,一般字幕文件的时间表达是“00:00:00.000”

知道如何从NBC下载BLF的外挂字幕,也知道了如何把下载回来的tt字幕转化为ass以后,所有痛点全部都打通了,最后的问题只是NBC最后会不会把这部电视剧全部都免费放出来。

youtube-dl单纯下载NBC网站视频外挂字幕的批处理脚本(复制下面的东西,做适量修改[比如文件路径],然后保存为.bat文件)

盘符
cd\改这里\改这里
youtube-dl –all-subs –skip-download NBC视频网址1(你得去播放页确定那个视频有外挂字幕哦)
youtube-dl –all-subs –skip-download NBC视频网址2(你得去播放页确定那个视频有外挂字幕哦)

困扰我的字幕问题终于有了一个非常完美的结局,实在让人喜出望外。

2021-05
17

痛苦全家桶的开胃菜来了

By xrspook @ 10:21:32 归类于: 烂日记

单位的下载速度很慢,家里的下载速度很快,于是我确信周末理论上我就一定可以把所有东西都下载回来,实际上不需要周日,光是周五跟周六两天我就已经把BLF 116集全部下载回来了,但问题是我把东西下载回来随机拉了一下,发现其中有些很有问题,比如说视频跟音频对不上,音频跟视频完全是错乱的,又或者视频在某个时间会卡在那里,音频还在继续。为什么会发生这种事呢?通常情况下,这通常都意味着上传或下载的文件不齐全。如果是从前从油管上下载的文件,遇到这种情况就意味着我重新下载一遍就好,我通常重新下载回来的文件要比原来那些大一些。有些视频的进度条不能拉,通常也是因为下载不齐全。但也不排除如果那个视频是别人上传的,上传的时候就已经出状况了。还记得我切过一些蓝光的视频,发现某些部分如果不用某些专业的东西根本切分不开,无论我多么努力还是不得不被某些关键针给卡住。AVI还好一点,MP4的关键帧根本不是用毫秒去算的,可能是5秒甚至10秒。

为了找出那些有问题的,周六晚上我一个一个文件拉。拉得不是很仔细,因为我想的是大概如果视频跟音频对不上,很大一部分都会出状况吧,而且这些事情通常发生在视频的结尾,所以如果视频的结尾进度条是无法拉的大概就意味着这个文件有问题。116个文件,我拉出了30个有问题的。网友那边把我帮我重新把这些搞回来了,然后我当我又重新对这些文件的时候,我不得不用左键头5秒快进来浏览一个40多分钟的视频,但当我试了一两个之后,实在顶不住,所以我改为了ctrl加左键头,也就是30秒一个快进。这样浏览速度是快了,但是到某些文件我发现不会整体的音频视频对不上,但就会在某个地方卡帧,卡个10秒。但即便我用30秒一个的快进还是会漏掉这些,所以我正一次反一次。即便我已经非常努力,还是难免会有这种事情发生。

后来帮我下载这些视频的网友发现下载回来的那些视频和网上播的时间如果有差别的话,通常就意味着出状况了。在NBC网站上已经放出来的BLF,绝大部分都是43分钟以内的,所以如果下载回来的视频时长大于43分钟,通常就意味着卡了,不管你有没有找到那个卡的地方,反正是一定有卡的。所以我们就彻底改变丝路,直接在网站上一个一个视频打开,把一个一个视频的播放时长抄写下来,然后在和我们已经下载回来的视频的时长做对比。

结果是惊人的!后面已经修正的那30个视频还是有7个有状况,余下的那些里面有40个视频有状况的,当我们彻底对比NBC网站上的视频后,发现我们下载回来的视频有47个是不一致的。再加上之前已经修正过的23个,118个视频里面有70个视频出状况。超过50%的概率!!!为什么居然会发生这种事呢?如果是用youtube-dl下载油管的视频不会发生这种事。因为我已经下载过很多了,虽然我用的不是这个东西,但是却从来没有遇到过这种事,当然大多数情况之下,我把视频扒回来了以后会对比一下。视频的播放长度因为绝大多数情况是不会有差别的,所以这次我们也就没有检查,导致了我们不得不进行大量的翻工。希望这次翻工以后那些播放时长全部能对上的视频不会有问题。

NBC的视频能随着新的一集放出以后旧的那些可以自动解锁免费看是件好事,但这些视频当我要把它们抓回来后又会发生这种问题。实在让我们始料未及。之前我觉得下载上百个GB的视频很痛苦,但现在看来,原来那些痛苦还都只是痛苦全家桶里面的其中一部分……

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress