“我国的观众习惯在视频节目中看字幕,因而古风歌曲、鬼畜才可能流行,因为没有字幕是很难光靠听听懂的这类作品的。”
“有人说弹幕都是短语,不需要什么语法,外文弹幕网站也完全可以形成自己的文化,使用各种简写,这里我们上一个对比视频,同样的弹幕内容,英文呈现出来的观感是不是明显差了点。”
陈博顺手截了个图,虽然英文弹幕的密集程度远不如中文,可字母间的遮挡严重影响了对弹幕内容的判断,反观中文弹幕这边,密密麻麻的字幕丝毫不影响陈博提取出弹幕内容。
汉字的倒序乱码在一定程度上不会影响读者的体验,但丢失单个关键字符就波及整体,例如我去找他要钅,到底是要什么,要钱还是要铁要铜。
这点在英语方面恰恰相反,即便丢失了一部分后缀前缀,仍然不会影响对句子的整体理解,正是因为英文单个字符所的信息量较少。
“根据最新出版的各语言信息熵目录,汉字单个字体的平均信息熵在968左右,而英文的信息熵则在323徘徊,信息熵越高,代表越无序,关于信息熵的计算过程,有兴趣的同学可以看看下面的公式和延伸。”
陈博顺着老师的指引点开链接,马上被一堆不知所云的公式下愣在原地,他借助看得懂的文字说明,试着对这些陌生的公式进行解读。