视频新文化运动

「阅读需时: 8 分钟」

我们处在一个非常重要的转折点,是一个视频逐渐取代文字的时代,这个时代需要一场类似新文化运动一样的工作,我们不妨称之为“视频新文化运动”。

视频新文化运动插图

新文化运动vs视频新文化运动

视频已经成为我们记录和表达的最主流媒介,并且在未来的20年只会越来越主流,这种视频取代文字的过程,像极了100年前,白话文取代古文的过程。

我们现在对于视频的大多数诟病,和100年前,古文的拥簇者对于白话文诟病如出一辙。比如,我们说视频看起来太浪费时间,太“水”,不够精炼,不够优美,表达不了太精微的思想,制作成本过低导致鱼龙混杂,内容无法筛选等等,而这些,不正是白话文刚诞生的时候,大家对于白话文的诟病吗?

而当年,胡适,蔡元培先生做了大量的工作,才解决了白话文的若干致命的问题,从而推动了白话文的普及,而对于视频的相关工作,现在落到了我们这一代人身上。

白话文的历史

我们来看一下白话文的历史。

白话文其实并不是新文化运动时期才产生的,而是从远古开始一直就流传的,大家日常交流的语言,比如唐宋时期大家说的,我们叫做白话。只不过,因为技术的限制(主要是纸张的成本),使得大家在书写的时候必须对白话文进行摘要,浓缩,从而形成了书面语,也就是我们现在所说的古文。

而新文化运动的重要分支,白话文运动,就是直接把口头上说的白话,不加过多更改的直接记录在纸面上,就称之为白话文。

而最初的白话文,有各种缺陷,比如没有标点符号。

古文就没有标点符号,但是古文有之乎者也等结构来表示断句,比如xxxx者xxxx也。大家可以想象没有标点符号的白话文是什么样子?几乎就跟现在没有剪辑过的视频一样!

是胡适先生等人在20世纪10年代末拟出了“住”、“豆”、“分”、“冒”、“问”、“诧”、“括”“引”、“不尽”、“线”等10种标点符号,后来又不断被标准化,形成了今天的标点。

同样的,早期的白话文更没有标题,分段,分节,索引,页码,开头空两个字等等我们习以为常的格式,但没有这些基础设施,白话文是无法真的取代古文的。

现在的视频取代文字,和当年白话文取代古文的历程何其相像。

视频的标点符号

现在的视频是没有标点符号的。我指的视频,是我们平时拿手机录制的原始视频。视频随着时间,同一个镜头,同一个机位,同一个音轨,毫无差异的流淌,就像没有标点符号的平铺直叙的口头表达。

我们看到的电影,电视剧之所以可以看得下去,是因为导演和剪辑师采用了大量的镜头切换,景别切换,背景音乐和音效,让我们有抑扬顿挫的感觉,而原始视频,并没有这些因素。我敢打赌,即便是奥斯卡奖获奖的电影,如果让我们看那几百个小时的原始的素材,没有背景音乐,没有切换,我们也必然看得昏昏欲睡,痛苦不堪。

这虽然没有像标点符号一样进入国家标准,但已经有成为事实标准的趋势。

如果对照白话文,我们有理由相信,视频里面的音效将会成为事实上的视频中的标点符号。

视频领域的段落

视频缺省是没有段落的,就如早期的白话文一样。

1919年,胡适等文化人逐步的引入了段落,目录,索引,使得我们在比古文长很多的白话文中也可以迅速找到自己要读的章节。

未来的视频,也一定会有比进度条更结构化的章节,用专场标识章节,用视频中的一些内置的进度条,不同颜色的分段标记,就如同有些精心编辑的书,通过在页边有不同颜色的色块可以读者稍微弯曲就可以迅速翻到另外的章节一样。

未来的进度条也应该是有颜色的,或者类似的设计,从而帮助读者在长长的视频中迅速的跳转。

同样道理,视频也一定会更有结构。我们现在很多视频制作者和平台都在有意识的使用视频的第一帧,就如同大家知道一本书的第一页我们称之为封页,最后一页我们称之为封底。他们虽然是普通的一页,但重要度远远大于任何一页。

未来大家一定会更加注重视频的前30秒。

前30秒虽然从技术上和其他的时间没有什不同,但是我期待未来的视频的前30秒就跟书的目录一样,用非常快的方式总结视频的内容,让我们判断视频是否需要看,以及大约在什么时间看到什么内容。

如果你需要一个例子的话,就看一下新闻联播的开头:“各位观众,大家晚上好。首先为您介绍本次节目的主要内容。。。。。。”然后才进入正式的内容。这样的结构,相比于我们手机里面任何无头无尾,平铺直叙的内容来说,就更像现代的白话文,而不是原始的白话文。

工具和结构的匹配

所有这些视频里面需要的结构,其实都需要工具来匹配。

我们虽然已经看到了很多视频里面这些段落,标点,目录的结构,但这些都还是手工制作,并没有工具支持,就跟活字印刷前的刻板印刷,虽然灵活,却效率极低,无法标准。未来一定有工具直接生成这样的内容。

张小龙在微信公开课上也提到,云端、结构化的视频才是视频,而不是原始的视频文件。这和我想象的未来世界非常一致。结构化的视频需要崭新的工具,而我们正在打造这些工具。

未来的视频的样子

如果我们分析从古文,到白话文,到视频的迁移过程,我们可以看到一个权力从阅读者向创作者迁移的过程。

假设我们创造一个指标,叫做写读时间比,就是创作内容所需要的时间与消费这个内容需要的时间的比例。我们可以估算一下古文,白话文还有视频的写读时间比。

古文的写读时间比应该是60:1左右,也就是我需要用60分钟创作一篇文章,而读者只需要1分钟就可以读完。古文一个艰难的编码过程和一个非常迅速的解码过程。尤其其中的唐诗,宋词,更是这种情况的极致。

如果你熟悉区块链的工作原理的话,写一首唐诗的过程几乎是区块链中挖矿的过程:

找到正好五个字,或者七个字,还要平仄正确,表意准确,需要不断把一个字放进去,计算一下是否符合文法和韵律,发现不合适再换一个,直到找到那最精确的一个字,就如同矿工拿一个个随机数放进区块头的nonce位置,然后计算哈希是否以那么多0开头一样。

白话文这个比例就小很多。写这篇文章的时间大约30分钟,我觉得你看的话需要5分钟,是60:10,和古文比有十倍的差别。对于原始视频,这个比例甚至高达1:1,就是如果我用1分钟录制视频的话,你也必须用一分钟才能才能消费,写读比继续下降。但很显然,视频的写读比已经下降到读者不可以接受的地步,所以未经过编辑的视频,是无法被消费的。

我们每天录了大量的视频,从会议,到婚礼,到旅游的景点,大多数视频如果不经过编辑,录了就录了,却很少会被哪怕自己看第二遍,就是过小的写读时间比导致的。

所以,视频不经剪辑,无法被消费,这是写读时间比这个因素的必然结果。

我们发现,随着媒介的变化,权力正在从内容的阅读者向创作者过渡。

原始视频必须经过浓缩,裁剪才能够被人使用。而视频如果需要剪辑,就需要配上10倍左右的时间进行剪辑。一个3分钟的片子,至少需要30分钟的剪辑时间。如果全都需要人工做这个工作,则会产生一个巨大的瓶颈,导致大量视频无法被消费。

所以,基于人工智能的自动视频剪辑将会是视频行业的最大的一个机会。

——

视频作为主流媒体,到现在也就几年的时间,还有大量的工作需要这个行业的从业者完成,这些需要解决的问题的重要度,不亚于胡适、蔡元培先生当时看到的需要推进白话文所必须要解决问题。

如果可以的话,我们不妨把这些努力统称为“视频的新文化运动”,希望我们能够尽快的找到和视频的发展速度相匹配的解决方案和工具乃至标准,从而让视频更快、更广泛的在生活的方方面面有更多的应用。