2016-03
14

初探语音识别

By xrspook @ 22:14:08 归类于: 烂日记

今天的blog我本想用语记(科大讯飞的一个把语音转化为文字的手机app)去写,但我还是放弃了,因为说话太快,但我脑子转得太慢。我脑子的转速只和我敲键盘的匹配,所以虽然是输出同样的东西,拿着个手机说啊说我就乱套了,该说的没说,莫名其妙的停顿和错误一堆。平时说话的时候我不那样,因为在没想好之前我不会说,我开始的时候肯定脑子里已经有东西了,但显然我写blog的时候不是那么回事,我是边构思边输出的好吗!说一句话容易,但要说一大段之前完全没编排好的内容是另一回事。但其实如果一直要我一句话一句话地录音,可能我也会非常不习惯,我几乎就没用过微信的那种短语音功能。为什么我的语言障碍在我打电话和普通交流的时候不显露,在我录音的时候却会糟糕呢?大概是因为我很紧张吧。

很久以前我就已经听说过科大的讯飞,因为小米的语音助手一直都基于那个。语音助手好不好玩呢,我玩过,纯粹测试性质,觉得不怎么好玩。一直以来我都没有用过讯飞的产品,他们有做语音识别的,也有做字幕的。手机上的应用主要是语音输入法和录音类产品。搞不懂为什么他们在PC机上不提供,但在手机app里却有。今天下载了他们PC客户端的“字幕大师”,那是按时长收费的!有30分钟的试用时间,往后是字幕轴制作40元/小时,中文音频自动识别为字幕文字40元/小时,暂无法提供英文音频的字幕文字识别。我那个去!我赶紧删了,因为我的目的是用来识别英文。为什么要这么折腾呢?因为我想做TZP DVD正片附带的导演评论,那是AK在说英文,AK有浓重的口音,有人说他说的是标准的英式英语,但我怎么听怎么觉得怪怪的。在TZP的DVD bonus里所有视频都有CC字幕可提取,但在正片里可提取的字幕只是电影本身的,导演评论的音频不配有字幕,泪奔~~~ 既然讯飞能做中文语音识别,外国,尤其是英语的语音识别应该更加成熟才对有木有!否则烂果的siri怎么玩起来?!!!在度娘输入speech to text时出来的结果几乎都是text to speech的,尽管已经绝大部分是英文资源,但这显然不靠谱啊!所以呢,这种时候必须请教G老师。G老师出来的东西主要就是speech to text!我那个去,我一直都很嫌弃度娘,若不是G老师被墙需要翻,我绝对不会将贪图方便用度娘!在外语资源搜索方面,度娘简直就是渣渣之中的战斗机!!!关于speech to text,主要需要解决的是引擎问题,有IBM的,也有Google Speech的,据说G老师的已经很不错,而且提供开放的API,但我要的只是个软件啊,不过实际上只要联网连软件都不用,光是利用G老师API的网页工具就足够了。今天我播放了一段AK评论,分别用讯飞的语记和基于Google API的网页工具语音识别。识别的两段话不同,所以没有绝对的可比性,但显然用Google API的网页工具出来的东西更靠谱符合逻辑,起码呢,人家的语句是基本通顺的,思路也不会太跳跃,讯飞识别出来的某些段落云里雾里完全不知道在瞎掰些什么。当然了,基于Google API的网页工具选择的语言在英语之后还能选择英语所使用的国家的!我当然必须一定得选India啊!但讯飞认为英语就是一种,和普通话、粤语、四川话等列为不同的类别,我那个去!讯飞针对的是中文识别,外国人针对的是多种外语的识别,当然不一样了!如果我要把印度人说的英语听写出文字来,我理所当然得信赖外国人的东西,说不定Google Speech的印度英语真是印度码农开发的呢。

无论是用讯飞还是Google Speech,摆在我面前的是我都必须把2小时42分钟时长的音频完全播一遍,想想都觉得这不是一般的疯狂啊……

一座大山横在我前面,但山再大,也比我自己纯粹靠听译来得稍微靠谱……

2015-01
14

折腾网页字体

By xrspook @ 20:45:22 归类于: 烂日记

等待,又是的等待!我非常讨厌等待好吗!凭什么是得我跟着你们去做你们的事,而不是你们跟着我们去做我们的事呢?!这完全就是觉得我们没事干闲得发慌于是硬是给点事我们干啊啊啊!那种从一开始就被看低一等的感觉太恶心。多年以来都说什么职业不分贵贱,但如果连你正常工作的时间和机会都没有,一辈子地当兼职神马,这算个毛线啊啊啊啊啊啊啊。别人有心要坑你是无法避免的,不往那个地方费任何关注就好。我不能理解那些不做好自己的事却一直纠结别人“可能”没事干的人到底什么心态。

昨晚打算花点时间解决DIR字体的问题,结果花了一整个晚上,到1130才睡觉居然还都没搞成,我被我以为的小儿科绊了一个大筋斗。一直以来DIR的某些字体用的是Google的font API,但自从G老师在天朝被阉割得越来越厉害后G老师的众多API当然无法使用了。我对这个并不怎么烦心,因为翻墙是我的基本技能,但不是所有人都懂这个且习惯做这个。过了好长的时间(接近大半年)我终于忍无可忍,决心要把从前简单地用

<link href='http://fonts.googleapis.com/css?family=Cabin+Sketch:bold' rel='stylesheet' type='text/css'/>

实现的功能改掉,因为,在天朝根本无法load出这个,要等浏览器load很久才最终意识到自己load不出是个连我自己都不愿意等待的事。所以很长一段时间以来,要打开http://adelrio.diandian.com/我都是用翻墙方式的,并不是这个网站有什么特别,只是因为我引用了需要Google API的东西,而那些东西又load不出来,所以导致网站假死,如果有足够多的耐心,当然可以打开,但显然,我连自己都懒得等。Google的Font API是个非常优秀的玩意,用一个语句就解决了让你自己去折腾半天都做不出来且很累赘麻烦的东西,他们有精确的浏览器判定,有经过cdn最优化的下载文件,我们这些凡夫俗子的脑子怎么可以跟他们比。精准我们比不上,因为我们不是浏览器控怎么可能每个都耳熟能详知道它们的脾气如何,要用什么格式的东西去喂养。我们也不会得到Google那么豪气干云的世界各地服务器,文件下载速度谁也不能保证能比他们更快了。但即便如此羁绊,我们还是得用很落后老气肯定有缺陷的方法去取代方便简单的高精尖,因为,事实摆在眼前,Google在天朝无路可走。

我用的方式是在css里自定义字体,也就是在css里作一个声明,从外部引用字体,然后在css里需要的某些元素里使用。这个方法很容易被明白,但难就难在不同的浏览器只会辨认某种或某几种字体,所以你要适配所有新老浏览器就得搞出N多来,比如说:woff,woff2,eof,ttf,svg等等。woff可以被Firefox和版本35以下的Chrome辨认,woff2貌似是Chrome 35以上的选择?反正我用了woff2,Chrome 39还是理解无能。IE这个屌丝只认识eof,IE6-8和IE9认识的eof版本还不一样!ttf比较大路iOS,Android,Firefox,Chrome,Safari,Opera都通杀。老版本的iOS只认识svg。想死的心都有了有木有!这还只是个开始!因为Firefox和IE还有同源网站规则,如果字体和网站都在同一个地方当然没问题,但作为一个前端设计,我怎么可能控制得了东西都能在服务器端呢!引用使用字体会让浏览器觉得不安全,和图片等不同,不同源就会导致浏览器无法正常加载你放在别处的字体。我那个去!我一直用Firefox做测试,难怪怎么搞怎么不对劲,但在Chrome上却一直对劲得很。关于这个不同源的问题,我举手投降。因为我肯定做不到让字体文件和DIR同源,我也做不到要求服务商点点在服务器给我来一句开绿灯的语句让我的字体文件不被浏览器觉得不安全。我只能自欺欺人地觉得,估计只有我这种少数屌丝是用Firefox来开DIR的吧…… 我自己的做法是在本地就安装我的特殊字体,字体引用的第一步是查找local,有了就不用下载那么麻烦了,不用下载当然在FF下也能正常显示字体。我已经尽力了好吗!

我使用的语句是:

@font-face { font-family: 'Cabin Sketch'; font-style: normal; font-weight: 700; src: local('CabinSketch Bold'), local('CabinSketch-Bold'), url(http://x.srcdd.com/farm1/5b7f4a/8fe24307/cabinsketchbold.woff) format('woff'),  url(http://x.srcdd.com/farm1/5b7f4a/28d84744/cabinsketchbold.woff2) format('woff2'), url(http://x.srcdd.com/farm1/5b7f4a/fbf35def/cabinsketchbold.ttf) format('truetype'), url(http://x.srcdd.com/farm1/5b7f4a/47370689/cabinsketchbold.eot) format('embedded-opentype'); }

即便这么写,但在IE7-8下仍是无法正常显示的,具体原因可能是同源规则。虽然设定了woff2,但在Chrome 39下仍是无能,原因母鸡,难道39也玩同源!但Chrome 35是woff和ttf都通杀这么好人的啊啊啊啊啊啊啊,怎么越长大越不对劲了!Firefox因为同源规则,无能。所以写了这么一大堆,试图去hack,但最终不过是在Chrome 35,搜狗浏览器,以及安卓手机(小米1S青春,Android版本为4.1)下OK。关于是不是同源规则导致的显示出错我可以在自己的网站上做测试,但知道和不知道结果都一样,泪奔~ 因为知道了我也无法要求点点在服务器那边做点什么。

要成功一点都不容易,要失败,一个细微问题就足够了。

2013-05
9

为了更黑更腐更脑残

By xrspook @ 16:46:13 归类于: 烂日记

每当我开始猛力思考,我就会开始死嚼口香糖,外加现在的益达粒装口香糖越来越硬,所以,通常我猛力2个小时后面部肌肉就会开始各种酸痛。还记得大学的时候,我有能耐连续嚼6个小时的口香糖,没有半点痛感。也不知道是我嚼口香糖的频率有问题了,口香糖本身构造发生变化了,还是我已经老了,脸部肌肉各种退化。反正,当我要计算、编程、翻译,反正是要开始思考的时候,我都会开嚼口香糖。这些操作通常很耗时,但嚼口香糖太久了面部会各种痛,很矛盾。

今天下无我开始花时间研究推特的图片搜索。这个玩意推特有API,他们有图片API,但只限于用官方的上传方式,实际上推特的图片上传方式五花八门。他们有搜索API,但搜索API只限于1周内的数据,而且他们也写得很明白,搜索结果可能不100%齐全。他们有状态API,状态API是全了,但抽风几率比较高。综上所述,如果我要做大包围的推特图片搜索我只能用状态API。问题是,状态API的官方说明是最少的。我的目的无非就是获取数据用我的目标格式输出,最重要的是通吃多种上传来源的图片,而且图片必须有直接的原图打开地址以及那条推特的内容及作者信息。

不知道API可以怎么用,如果必须用OAuth的话我就更加无从下手。

但我想研究出来,虽然貌似这个完美境界非常不容易。而我为了实现这个居然就只是为了我抓图能更加方便,不用开N个网站,点击N多下。

归根到底为什么我要这么执着地猎奇?因为我不想错过任何一张图片,但我又很懒不想人肉过滤垃圾信息远远多于图片信息本身的每一条推特。估计只有脑残级的程序员才会做这种神经事。脑残很简单,程序员也很简单,但脑残在某个方面,某个和程序员本身完全没啥交集的方面这非常奇葩。

作为一个图片控,我居然会迷上写一个程序专门获取WWE.COM的图片,静态的网站还好处理,现在我居然把魔掌伸向了社交网站。不得不承认,我已经病入膏肓很严重……

永远追求更高更快更强,而不是更黑更腐更脑残,无论你信不信,我却是因为要实现后面那个才给予前面那个正能量行动起来的,绝了……

2010-10
14

不死

By xrspook @ 18:00:26 归类于: 烂日记

到底T有多邪恶呢?为什么就不能T?!今天早上刚在alwaysdata搭建了一个twip4,O模式非常好用,也用上了Chrome伟大的插件Chrowety,甭说它老人家有多伟大了,感觉比经典老牌的Firefox插件Echofon漂亮好用,最好的是Chrome本来就系统占用率低,Chrowety又是可以独立窗口的,于是,自然而然地就能成为一个很好的客户端。不过,好景不长,下午干完事回来发现T不了,接着悲情地发现alwaysdata那边“Account suspended”了。GW的魔掌应该不可能伸展到法语那边,是主机拒绝api了。多悲情啊!好不容易挑到一个好用的客户端,马上又因手上没票子而只能继续上官网。

想T,就得天天update自己,时刻处于备战状态。是我们让GW变强,而我们则因GW会变得更强!

不死是基本信念!绝对不能有妥协的心态!!

下午华丽地完成了一个稻谷脂肪酸值,嘿,要感谢那个黑暗的6、7月,要感谢想把我逼死的各级领导,正因为你们曾经的非*道行为,我对这东西算小有底了,能轻轻地喊一句fear not。

突然想起了John Cena T恤上的那句“NEVER GIVE UP”。生活中不如意事十有八九,只有一直保持这种心态才能永远前进、前进、前前进。

2010-10
13

囧事一箩箩

By xrspook @ 18:11:12 归类于: 烂日记

话不投机半句多。今天就遇到了这么一个人,在办公室“绑”住我们吹了一早上的水,下午,回来以后还硬逼我制造话题,某些东西我并非不知道,但真不想给他“透露”那么多。但他就纠缠着你,烦!不过是七十年代末的人,怎么会那么“长气”呢?

自从惊讶地发现GTAP的KEY每刷新一次都会变化后,twhirl彻底玩完了,太恐怖了,理论上那个KEY应该是设定好就不会跳,实际呢?每一次刷新页面进去都不一样,这不是整人么?而KEY正是登录密码,如此一来,根本无法登录。难道是T自己干的好事?还是那该死的G*W的恶心操作。一般的网页api搭建容易,但要符合twhirl的登录格式要求却屡屡碰钉,twhirl最绝配的组合是G的api,但G的apps是有限制的,好像一共就只有10个域名,一旦全部都撞了,那不惨哉?所以,不能太绝。网页是无限的,免费页面取之不尽,最重要是研究一种能适合好用客户端的api制造法。

今天twhirl神经病,真理部也神经病,不得不直接去官网,但,我依旧是大爱客户端啊~~~

已经看了这周20101015SD的剧透了,Bragging Right 2010里,SD team的7个成员分别是:Big Show & Rey Mysterio & Jack Swagger & Alberto Del Rio & Edge & Tyler Reks & Kofi Kingston,老天啊,这个什么组合?????Rey Mysterio《》Alberto Del Rio还有Jack Swagger《》Edge,两对冤家在一组里,暂不说丝袜哥和Edge会不会怎样,Rey Mysterio和Alberto Del Rio 99.9999%会内讧自己打起来,Tyler Reks通常是酱油男一个,于是SD队剩下的就只有Big Show和Kofi Kingston,囧!面对The Miz & CM Punk & Sheamus & John Morrison & R-Truth & Santino Marella & ?的RAW队基本上可以说SD输定了。

希望,明天会稍微好一点吧。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress