从我自己的经验来看,写作者有时会因为专注于内部的逻辑自洽,而忽略了外部事实,从而做出不恰当的判断。这一现象在分析哲学中也有所讨论,被称作「反现实主义」。1对读者和写作者来说,盘逻辑很爽,但对照现实却是一件痛苦且麻烦的事情。对于物理学家来说,用实验验证理论时也常常引发「物理学不存在了」的灾难。
在建立自己的理论和思维框架时,现实的冲击是不可避免的。只构想不实践,其弊端与危害想必不用多说。在这篇文章中,我想要从计算机领域对「信任」一词的定义开始,谈一谈如何获得靠谱的知识来为自己的认知做背书,既是为了满足身为读者和听众的求是态度,也是为了尽到写作者和传播者的义务。
什么是值得信任的?
正在阅读这篇文章的你,大概也是一位独立博主,有过自己搭建网站的经历,那么你多半折腾过网站的 SSL 证书。作为网站维护者,你必须为 Web 服务器配置 SSL 证书,才能使用 HTTPS(超文本传输安全协议)与访客建立连接。在当今的 Web 环境下,不使用 HTTPS 早就被视作「不安全」的做法,浏览器把仅使用 HTTP 协议的网站标记为「不安全」,让用户提高警惕,不要输入银行卡号这样的敏感信息。
其实不难发现,为网站签发并配置 SSL 证书并不是什么难事,仅有一些不高的技术门槛。那么,既然任何人都能获得 SSL 证书,为什么没有证书的网站就是「不安全」的,任何人只要为域名申请并配置了 SSL 证书,就会被认为是「安全」的呢?
HTTPS 是一种安全的传输协议,SSL 证书并不保证网站本身提供的服务在功能上是安全的,而是保证内容在传输过程中是安全的,不会被第三方窃取。骇客不能伪装成腾讯来骗取你的 QQ 账号,因为他无法获得签发给 qq.com
的可信 SSL 证书。HTTPS 协议在传输过程中使用了非对称加密,你可以通过证书的公钥给要发给网站服务器的内容加密,然后服务端再使用只有这个网站才持有的私钥进行解密,这样黑客即使在信道中截获了报文,也没有办法解密。
简单来说,SSL 证书其实是对「身份」的认证,只有域名的所有者才能获得该域名的证书。
前面提到,非域名所有者无法获得该域名的 SSL 证书,因为证书签发机构在域名所有者通过 DNS 等方式证明自己身份之后,才会签发证书。那么,会不会有非法机构跳过检验步骤,给不法分子签发证书,伪装成其他人骗取信息呢?或者,骇客能不能通过技术手段自己给自己签发证书来伪造身份呢?
答案是:不行。给自己签发 baidu.com
的证书在技术上是可行的,但问题在于没有人会相信你真的是百度。大部分的浏览器和操作系统都内置了一个受信任的根证书颁发机构列表,只要一个网站的证书的根证书是由这些机构签发的,那这个证书就是可信的。证明一个证书是不是由某个机构签发的过程也用到了非对称加密,这些机构持有自己的私钥(其他人无法获取),用这些私钥给证书签名之后,其他人可以用他们公开的公钥解密来验证签名,以确定身份。
另一个问题:这些受到广泛信任的证书签发机构就那么几个,如果人人都要从他们那里获取证书,那效率会不会太慢了?实际上,这些机构还会签发中间证书,用中间证书签发的 SSL 证书也是与根证书关联的,也能证明身份。2
有了中间证书的存在,某个域名的证书与签发机构的根证书之间就形成了一条信任链,只要信任链能够追溯到受信任的机构,与网站的连接就被认为是可信的、安全的。
当然,这篇文章并不是为了鼓励你使用 PGP 等非对称加密方式让别人验证你的身份3,重点在于「信任链」的建立。如果信任链能够追溯到一个可信的来源,当前的实体就是可信的。
对于「知识」来说,要如何建立信任链呢?让我们把目光移至学术领域,来看看「参考文献」在学术的实事求是中发挥的作用。
时常被忽略的参考文献
除了小说、散文等文学类作品,以及作者观点占主导的书本,我基本都会在阅读时仔细检查这本书有没有标注参考文献。一般来说,一本书的参考文献会出现在三个地方:
- 书本的最后几页,可以在目录中看到;
- 每一章的最后;
- 在脚注中被标注,精确到一句话的来源和事实根据。
如果一本较为严肃的、涉及很多事实性证据的书没有参考文献,我会对作者以及出版社产生不好的印象,同时也会对书中内容的真实性打上一个问号。那本气得我写了一篇文章来骂的成功学书籍《逆商》,丝毫不吝啬丢出各种数字炸弹,动不动就上百上千,罗列百分比,反复强调自己做了怎样的科学研究,却不肯在任何地方给出参考文献,我要怎么相信作者的信口开河?对于《天生不同》这本书,我也批评了它不吝啬罗列研究数据,但不给出任何事实来源的做法。
这两本书是较为极端但很常见的例子,作者(也有可能是编辑删掉了)完全没有给出任何来源,让信任链无从建起。对于信任链根本就不存在的内容,质疑是必然的。
不只是书籍,如果内容标注有参考文献,信任链可以被建立。一般来说,书籍标注的参考文献是正经的学术文章或研究报告,是很容易被检索到的。当检索到对应的文献时,对于一般不阅读文献的普通人来说,应该关注:
- 文献发布的日期,这之后有没有相关的文献补充或反驳它,以此来判断是否过时。
- 什么样的研究方法被采用了,有可能这样的研究方法在当今已经被认为是不严谨、不正确的了。
- 一般来说,严谨的学术文章会有一小节用于论述该研究的「局限性」,承认它得出的结果并不适用于所有情况;关注你要查证的内容是否在该研究的范围之内。
- 通过关键词检索找到你要查证的信息的来源,具体到出自哪一段落、哪句话。有的作者会在标注参考文献时,直接引用文献中的句子,这样既证明了内容的严谨,也方便读者查证。
精确到具体段落的原因是,尽管有的作者标注了参考文献,但可能因为一些主观原因(理解错误、有意或无意地夸大事实、措辞不当等)让阐述偏离文献所呈现的结果。
当然,对每一条事实都做这番查证当然很累。如果不是做科研,又想要展现出严谨求是的态度,就应该对于论点中较核心的支撑论据进行溯源。此外,对于准确到具体数字的数据,包括百分比,也应该标注来源。4
科学研究很多时候都是踩在巨人的肩膀上的,一个研究成果大多数时候不可能由一个研究小组单独完成,一篇学术文章多半也引用了其他人的研究结果。信任链不是到一篇参考文献就停止了,要溯源的是事实和观点。如果一个事实中包含了另一个事实作为支撑,那么后者的来源也应该被追溯。你可以把查证的过程想象成计算机程序的递归算法,如果在一个事实中发现另一个未被信任的事实,就用相同的方法追溯到一篇参考文献中的具体段落。
鲁迅到底有没有说过这句话?
在我们讨论的话题当中,也有不少内容是无需严谨的事实依据的,或者说,我们需要的依据来源于某人的观点。最典型的例子是,有不少人会声称某句名言是某个名人所说的,但并不给出任何来源,当查证之后才发现这个人没有说过这句话,或者与原文有很大偏差。这样的现象,甚至在大学的课堂上也非常常见。
鲁迅是经常被引用的一个作家,但近年来有不少人在网络上调侃,说很多作者喜欢给随便一句话标上「鲁迅说的」以此来辅助证明观点。先不谈「鲁迅说的就一定是正确的吗?」,关键在于这些话并非鲁迅所言,信任链也无从建立的。我的高中语文老师也就此事发表过看法,他说只有「我没说过这句话」的确是鲁迅说的。这听起来是句玩笑话,真的是鲁迅说的吗?我不知道,因为我没有查证过,所以我不能把它当作事实来讲。
要对观点进行溯源,可以不建立完备的信任链,因为观点与事实不同,不依赖信任链而成立——对于自然科学领域的学术文章来说,不少事实是通过多个研究一起证明的,因此必须依赖信任链;对于某人说了什么话,找到这个人在何时、何处、说了什么就行。对于观点,通过信任链溯源反而容易被第三者的诠释方式迷惑。
我之前在写《尽情在舒适区里狂奔》的时候,在收集资料时用到了 ChatGPT,他说尼采的《查拉图斯特拉如是说》中提到了某个观点,我手边正好有这本书,于是我问他这个观点出自哪个章节,最后确实在他的指引下找到了相关的段落(但它给出的引文是编撰的)。大语言模型在计算概率输出答案时,可能会认为「编撰一个不存在的来源」是概率更高的做法,因为它作为计算机程序,没有对事实进行查证的能力;只有用户把事实摆在他面前时,他才会将其作为上下文进行运算,认为「编撰一个不存在的来源」是概率更低的做法。因此,通过大语言模型收集信息时,更有必要进行溯源。
在内容中引用某人的观点,应当标注直接来源,而不是标注「其他人说他说了这句话」——这不是法庭,足够的目击证人并不能证明此人的确说过这句话,听过曼德拉效应吗?5
被信任的就是正确的吗?
当我们通过追溯信任链证实了一个事实的可靠性,或者找到观点的最初来源以证实其真实性,我们就可以认为这些事实和观点是被信任的。接下来就出现了另一个问题:被信任的就是正确的吗?
这很容易扯到一个哲学问题上,即「什么是正确的?」。对于受过现代科学教育的我们来说,「正确的」很多时候意味着「合乎理性的」,黑格尔又说过「凡是现实的都是合乎理性的」6。因此,不少人会认为现实的、存在的才是正确的,对于抽象的观点,也需要被实践检验之后才能被认作「真理」。至少,「信任」似乎不能作为真理的依据。
但是,有多少人有能力从事科学研究,使用科学方法检验真理呢?难道每个人都有时间和精力去检验每一条信息吗?答案可想而知。几乎每一个人,都或多或少地依赖「信任」作为判断对错的依据。我们认为 1+1=2 是对的,并不是因为我们证明了 1+1=2,而是因为我们信任数学老师以及过去的所有数学家——这样一个群体,当然是值得信任的。
往大了说,「信任」从根本上讲与「信仰」挂钩。我们认为上帝不存在,是因为我们信仰现代科学,同时不信仰基督教。7当然,信仰是复杂的,基督教徒依然可以信仰现代科学——除了个别极端狂热信徒,我相信大部分基督教徒生病了都会去医院看病,而不只是在教堂向上帝祈祷痊愈。
现在回想一下我们建立信任链的过程,实际上是在将事实追溯到一个被我们完全信任的来源,与 SSL 证书信任链最终要被追溯到一个受信任的根证书签发机构如出一辙。拿数学来讲,我们认为一个公式是正确的,是因为它可以被推导证明,推导的过程就是建立信任链的过程;推导时必然也用到了其他的公式定理,我们认为这些公式定理可信,也是因为它们可以被推导证明。我们之所以认为「推导的过程是可信的」,是因为我们信仰数学,信任数学方法。
人类大概没有办法完全正确、客观、理性地认知世界,对于个体而言,判断「什么是正确的」,就不得不依赖「信任」,要将任何事实和观点追溯到符合我们根本信仰的来源,才能判断正误。
信任链必须追溯到根本信仰吗?
显然,我们仍然没有足够的时间和精力,将事实追溯到根本信仰。还是举数学的例子,我们不会在推导公式时,证明用到的每一条公式定理,如果我们这样做,公式定理就失去了存在的意义。我们将公式定理作为事实来使用,是因为我们对它有足够的信任。
信任链中的关键节点不必与根本信仰直接相关,但一定是充分可信的。就像证书签发机构除了签发根证书,还可以签发中间证书一样,我们可以允许这样的「中间证书」作为信任的代言人。在数学的例子中,证明了那些公式定理的数学家,对于个体而言,就是数学的代言人。只要我们信仰数学,信任数学家,我们就能信任由这些公式定理推导出来的结论。
要保证信息可信,且便于普通人查证和溯源,个体应当选择自己信任的代言人。对我而言,维基百科就是一个较为可信的代言人——维基百科上的词条编写都非常严谨,会在脚注标注事实来源,对于那些不清晰、不太可信的来源,维基百科还会在页面中标注「缺少引用」或「来源请求」。8
对于个体信任的「代言人」,个体不必进行更深入的研究,不必点进维基百科脚注中的链接查看文献内容是否可信,因为个体信任维基百科,所以默认信任链已经被建立了,除非内容非常反直觉、非常可疑。即便真的有可疑的内容,读者也可以通过参考文献找到来源进行确认。
不被信任的就不能说吗?
在播客《独树不成林》第 190 期节目中,嘉宾作为记者表示,记者的一条职业操守是:没有被拍到的就不存在。即使记者目睹了雪怪出现,但没有拍到清晰的雪怪照片,就不能声称雪怪真的存在。就像学术文章里,就算你真的听过某个名人说了一句话,也不能将其直接作为论据,因为他没有留下可以作为参考文献的文字资料。
这些内容固然是不被信任的,那不被信任的就不能说吗?
我的观点是,可以说,但不应当作事实来讲。在讲述之前,应当承认自己主观偏见的存在以及自身经验的局限性;你可以坚定地表达自己的信仰,但不应该期望任何人相信你,因为信任链无从建起,信息没有办法被查证。
我认为最重要的是自我觉知和承认偏见。换句话说,你可以发表暴论,但应当承认你的言论是不理性的、不客观的、不正确的,言外之意就是「不值得被信任的」。对于信息的接受者来说,如果发现某人的言论缺乏依据,也应当给他打上一个「不值得被信任」的标签,在通过受信的方式查证之前,不应该听信。
对于没有那么严肃的博客写作,缺乏依据的观点兴许可以接受,但读者首先要清楚「这个作者的观点不一定可信」,作者最好也拿出实事求是的态度,从自己信任的来源找到依据并标注在文中。
结语:人类、信任与真相
《爱、死亡、机器人》第一季中有一集,主角驾驶飞船进行空间跳跃时,发生了路线错误,落到了距离地球几千光年的地方。这里有一个外星生物,它篡改了主角的认知和记忆,让他以为飞船只出现了几光年的偏差,外星生物也伪装成他的旧情人跟他叙旧9。在最后真相败露时,外星人带着哭腔说它爱着所有迷失在这里的人,表示主角还没有准备好接受真相——他的船员都死在了休眠仓里,自己也瘦成了皮包骨,他们被困在一个丑陋、恶心、破碎的空间站中。在故事的最后,男主的记忆再次被窜改,回到了一切的开头。这次,在他饿死之前,不必再面对丑陋的真相。
可以说,当我们选择信任某条信息、某个来源时,可能就处在这样的困境里,永远与真相隔绝。我们可能无法接受真相,或者无法认识真相——人眼中的世界和动物眼中的世界当然是不同的,那凭什么认为人眼中的世界才是真的?凭什么认为人认知世界的方式才是最高级的形式呢?
既然人无法完全认识真相,就只能选择相信某种对现实的诠释方式。我认为,人对真相的认知,是必然不能脱离「信任」的。许多人、许多学派甚至教派的观点冲突,追根溯源,也大概是根本信仰的冲突——因为信仰不同的世界观,所以信任不同的对现实的诠释方式,所以不信任、不认可对方的说法。假设有「绝对理智」的存在,它看到的,可能只是几群同样愚蠢的人类在唇枪舌战,而他们都没有涉及真相的皮毛。
尽管信仰会带来认知的局限,但为了维护世界观的稳定,信仰是必不可少的。建立自己的信任链,在我看来,就是剖析自身信仰的过程,因为信任是信仰的具体表现,当你明确自己信任哪些东西,你就能摸清楚自己信仰的成分。
信仰和信任的话题还可以延伸出许多的内容,那么就留到之后的文章再谈吧。
回见!
但不得不说,如果熟悉这种技术(并不复杂),发布自己的公钥、保留私钥,以此来让任何人都能够验证自己的身份,确实是很酷的事情。 ↩︎
经常用「百分之多少」信口开河的人并不少见,互联网上的一些 KOL 尤其爱这样做。数字能让人觉得「这是正确的」「这是严谨的」,但似乎很少有人关心数字是不是真实的。除非你在讨论「二八法则」这样的大家都清楚是虚指而非具体数据的内容,否则就应该为自己列出的数据负责。 ↩︎
“虚假的记忆有时会被多人分享,这有时被称为曼德拉效应,一个突出的例子来自2010年的一项研究,该研究对熟悉博洛尼亚中央车站时钟的人进行了调查,该时钟在1980年8月的博洛尼亚大屠杀爆炸事件中被损坏。在研究中,92%的受访者记得自爆炸事件后时钟一直停摆,而事实上,时钟在袭击发生后不久就被修复了。几年后,时钟又被停了下来,并被设定为爆炸案的时间,以纪念和缅怀爆炸案。 其他此类例子还包括记忆中贝伦斯坦熊(Berenstain Bears)的名字被拼成了(Berenstein),美国服装品牌织布机果实(Fruit of the Loom)的标志上有一个玉米花,以及1990年代存在一部由喜剧演员辛巴达主演精灵,名为《Shazaam》的电影。” —— 曼德拉效应 - 维基百科,自由的百科全书 ↩︎
德语原文:Was vernünftig ist, das ist wirklich; und was wirklich ist, das ist vernünftig. 来源:Hegel, Grundlinien der Philosophie des Rechts, Frankfurt am Main 1972, S. 11。这句话常被误传为「存在即合理」。 ↩︎
是的,在我看来,和宗教信仰一样,对于科学的信仰也是一种信仰。唯一的区别是,科学给了普通人解释世界的能力,而不是将一切都解读为神的旨意——只不过大多数人都不会自己解释世界,对他们来说,信仰科学与信仰神没有太多区别。 ↩︎
对比百度百科用娱乐新闻报道作为参考文献的做法,差了不止一星半点。 ↩︎
这俩人还上床了,我现在还在想那个男主究竟有没有和长得像蜘蛛一样的外星人做爱,简直令人头皮发麻…… ↩︎
如果你觉得文章对你有帮助,可以考虑赞助作者
如果评论未加载,请尝试刷新页面