为什么你需要一个自己的知识库?
不知你有没有过这样的感觉——离开了学生时代以考试为主的评价体系后,自己的记性,好像不知不觉变差了?
遗忘是分数的天敌,因此,回想当年,在所有的初高中里,你能见到的几乎每一个学生都在参与一种斗争——对抗遗忘的斗争。环境驱使着你去朗读、记忆、书写、活用,直到几年之后,你在面对一张试卷时,能清楚地忆起这些年里或主动,或被动进入你头脑中的东西。
是的,这是我们每一个人都体验过的感觉,经过刻意的训练和刻苦的努力,在脑内一点点搭起一个庞大知识体系的感觉。这当然不错,很厉害,让人钦佩,但问题是,有些人此后的半生,便形成了路径依赖,不加思索地将这种模式重复套用,再不去思考一些显而易见的有趣问题——形成真正难以遗忘的长期记忆,到底为什么如此费劲?离开了那种“非记不可”的环境,花费这种努力是否还值得?或者说,是否还存在更高效的学习模式?
要解答这一系列问题,我们需要先清楚一个事实——大脑的强项是思考,而并非记忆。
离开学校,我们的记忆能力其实并没有实质性的改变,只是脱离了专注于记忆的环境后,人脑的一些本质特点得以暴露:从现代电子信息储存系统的视角来看,这一器官就像一块容易消磁的破磁盘,实在低效得吓人。老生常谈的“艾宾浩斯记忆曲线”无数次佐证,大脑的注意力和记忆力其实都非常有限,在无重复输入的情况下,刚学习的知识,在 1 天后,66.3%将被遗忘,记住的只有 33.7% 。
而人脑在记忆领域会有这样的表现,其实也不难理解,毕竟, 从演化论的视角看,人类的大脑从来都不是为了今天的信息时代而生的。 但是,在今天,这样一个“不擅记忆”的器官,要承受什么样的负荷呢?
根据 IDC2017 年的《数据时代 2025》白皮书,到 2019 年,全球的网民数量将达到 40 亿,其中中国有不到 9 亿的中国网民。且根据这家机构做的测算,他们估计到 2019 年,互联网上的信息量将达到 40 个 ZB(1ZB=10^12 GB),而今年已经是 2024 年,也就是说,理论上每个网民会平均分配到大于 1ZB 的数据量,但实际上,人终其一生在互联网上涉猎到的信息,只有不超过几十个 TB 是有用的“有效数据量”。
可见,在此等数量级的信息面前,无论是筛选信息还是记忆信息,人脑那点效率实在显得有些杯水车薪——我们迫切地需要一些能提高效率的辅助工具,而这就是知识库存在的意义——一个外置的第二大脑,专注于储存和记录,让你能够真正投入于更本质、更重要的工作:思考和理解。
当然,也许你会说,在如今这个“在线化”的时代,要解决知识的广度问题,似乎有更好的解决手段——搜索引擎无所不包,想知道的东西搜索一下就有,特意再搭一个知识库,听起来似乎是重复造轮子的行为。没错,在这一层面上,个人知识库确实比不上在线搜索,但我的回应是: 知识库本不是用来解决广度问题,而是深度问题的。
我们不妨回想一下,自己的灵感、想象和天马行空创意究竟是怎么来的?显然不是靠堆砌搜索引擎的搜索结果。外界的信息输入后,要在脑内经过一系列整理和转化,理清关系,打通关节,才能最终蜕变成所谓的知识、灵感和其他产物,下图便形象地展示了这一过程。
搜索引擎里得到的结果,充其量只能算作“data”,依旧需要进行进一步加工,无法直接使用,而所谓知识库,也不是用于记录这些原始数据,而是用于记录经过你大脑思考和理解的“information”甚至“knowledge”的。
比如,某些信息你当下可能还无法消化,或者无法深入理解,但你对其已经产生了初步思考,此时不妨将其记录下来。某天,也许你看到了与其相关联的信息,感到二者可以相互印证,打开知识库,你就能让自己过去的思考与现在的思想对话,比起再从搜索引擎里提取信息来加工,就省去了中间大量的构建环节。而其意义不仅在于节省了时间,更避免了思路的遗忘,保持思考路径的连贯性,也更容易组织起更庞大、更复杂的思维网络。
简而言之,知识库的意义在于保存你的思考,留存知识的“半加工”和“粗加工”形态,让过往累积的信息变得更易于追溯。读到自己过去的思考,就如同与过去的自己对话,而这一行为能收获的启发和思索,有时甚至远胜从外部输入的所谓先贤哲语,名篇巨著。
了解知识
在真正开始设计你自己的知识库之前,我们还需要了解知识,知其特点,才能设计一个具有针对性的容器。
知识的基本单位
关于知识体系的学说有很多,其中对于知识的模型也不尽相同,于我个人来说,我更认同 Zettelkasten 方法的“知识卡片”模型。在此模型中,知识的最小单位是一小段称为“知识卡片”的特定文字,其大致包含以下内容:
- 标题: 亦即核心观点。
- 标签/tag: 标识内容,聚类内容的方式。
- 主题内容: 知识的具体内容(经过自己整理过的文字,而非摘录或复制粘贴,且符合原子化规则,只包含一条知识)。
- 链接: 和其他知识的联系。
- 出处/参考文献: 此知识的出处/信息源。
这样一张“知识卡片”,有确定的中心主题、有分类标识、有经过思考和整理的内容、可溯源、与自己的其他知识有一定的联系,不仅完整,而且具有良好的可用性,在我看来是一种较为理想的知识形态。当然,根据理论和模型的不同,知识的基本单位也可以有其他形态,此处只为举例说明,读者也不必强求认同我的观点。
知识的结构
了解了知识的基本单位,我们还需要进一步理清知识与知识之间的关系,这将决定我们采用什么形式组织我们的知识库,此时,不妨回到最初始的需求场景:因为深感处理信息的任务日益繁重,所以我们想为大脑找一个合适的辅助工具。又因为这个工具应当配合大脑的工作流程,因此,我们应当尽量让其结构贴近大脑组织知识的架构。所以,问知识的结构,其实是在问另一个问题—— 我们的大脑,是怎样储存和架构知识的?
先从最浅显易懂的部分开始。
简单按照时间长短来分,我们对于知识的记忆可以分为长期和短期记忆,长期记忆保存的时间较久,最长可维持终生,而短期记忆有两种结局,遗忘,或转化为长期记忆。
为了将短期记忆转化为长期记忆,我们可以采用很多手段,总结起来,大致是以下三种,在后文设计我们的知识库时,我们可以模仿其形式,达到类似的功能:
- 创造关联: 和原有的记忆关联。一个信息与其他信息之间的联系越多,就越容易被记住。原理大致有两点:首先,依赖原有的记忆,可以帮助我们理解新的记忆。如:学习加法后,乘法的概念就可以构建在加法之上,很好理解,但一开始就学习乘法,理解就会困难很多。其次,人存在“非自愿记忆”,即:人脑在记忆时,会顺带记住很多你可能根本不会注意的其他细节,如当时的天色、环境音等,如果能将这部分利用起来,唤醒回忆会变得事半功倍。有时候,私下一个人能把稿子倒背如流,上台却支支吾吾,很可能就是台上的环境与平日记忆的环境相差太大,记忆无法很顺利地唤醒,另外,目前认为,“既视感”的形成很可能也与此有关。
- 简化+抽象: 计算机的数据库为了加快搜索速度,会建立索引,而我们将记忆结构化、抽象到人脑可以理解的逻辑关系和思维模型中,往往也有助于更好地把握知识,经济学的供需模型,数学的函数关系等皆为实例。《金字塔原理》提出,人类有且仅有的两种思维方式就是归纳和演绎,善用这两种思维,对我们深化记忆大有帮助。
- 间歇重复: 形成长期记忆需要重复刺激,最直接的办法就是间歇重复。
上面,我们已经提到,在人的脑海中,多个记忆之间存在着联系,那么,这种联系又是以什么形式存在的呢?有些读者可能会想到,物理层面上,人脑的神经元似乎是以类似网状的形式彼此连接,那么,知识的连接结构是否也是如此?
答案是:不完全是,大多数情况下,知识是网络结构,少部分情况下则是以树状结构连接。
未经梳理的自然状态下,一条条知识往往以一种零散的、不完整的杂乱状态出现,他们彼此之间可能有连接,却并无清晰的层级结构,这就是所谓的网状连接。然而,并不是所有领域的知识都处在这样的状态,某些时候,我们接触到的知识已经过梳理和编排,有明确的“主干”和“分支”,有清晰的层级结构和框架,这就是树状结构的知识。
基于此,我们便可以初步确定自己知识库的结构:如果你接触的大部分知识是网状结构,那么你的知识库就应该以网状结构组织,反之则采用树状结构。
例如,对于大部分在校学生,他们接触的往往是课本上编排好的、系统的知识——很显然,课本是树状结构,上课也正是按着课本,循序渐进地学习,那么你的知识库毫无疑问应当是树状结构。反之,如果你已经到了研究生或以上的阶段,需要自己读文献、做研究,或者你是某个领域的业余爱好者,自己去摸索和学习,那么此时你接触到的知识,很有可能就是碎片化的,应当以网状结构来组织。
值得一提的是,正如文初我们提到的,如今已是一个信息爆炸的时代,互联网上散布着许多来不及被系统梳理的碎片化信息,如果想要针对这部分信息做整理,很显然,在最初,采用网状结构是比较合理的。
“最初”又是什么意思?这正是我要强调的另一点: 所谓的“树状结构”和“网状结构”并不是绝对意义上的概念,运用时切忌死板硬套。实际上,当你的网状知识库已经累积了一定的内容,你完全可以自己动手把它进一步梳理成树状结构,从这个角度来说,组织度最高的树状结构也许才是一切知识库的最终归宿。
搭建知识库
有了上面的信息作为参考和铺垫,我们终于可以开始设计自己的知识库。
上文我们提到,知识库应当贴近大脑内知识的组织结构,同时尽量贴合你接触的知识结构,据此,我们大致有树状和网状两种选择。
而根据知识库组织形式的不同,我们应当采用相对应的笔记方法,此处仅列出较典型的两种形式以供参考,当然,读者也可以选择自己中意的其他笔记方法。
知识库的记录方法
网状结构的笔记——卡片笔记
上文我们提到了“卡片盒笔记法”,而这就是一种典型的,适用于网状结构知识体系的笔记方法。此方法的概要是将每一个知识做成一个知识卡片,放到卡片盒中。笔记与笔记之间,可以创建联系,或是引用、或是类比。或者用标签将同类的笔记聚类到一起。这个过程和大脑非常相似。
卡片笔记适合用来存储零散的知识点。如:读文章、读文献时出现的相对独立的知识等。
树状结构的笔记——大纲笔记
大纲笔记,即:有明确的目录或脉络的笔记,对应经过梳理的树状结构知识, 一般产生于阅读书籍或学习课程——这一部分知识便是上文提到的,由其他人梳理好的树状结构结构。当然,你也可以自己组织知识之间的关系,建成树状结构。
多知识库分类问题
假如你有不止一个领域或项目有搭建知识库的需求,那么最好的方式应当是搭建多个知识库。但这样一来,我们又会面临另一个新问题—— 在库级层面上,我们又该如何组织不同的知识库?是否需要按照学科、项目、领域分类?
过去流行的知识管理方法里,提倡过使用学科分类的方式来给知识库作区分,但在亲身使用过一段时间后,我逐渐体会到,为什么如今这种区分方式逐渐被抛弃: 它引导了一种错误的思考方式,即:在动手记录前,先去思考这个知识属于哪一门类,去想应该存放在哪里,这种记录模式在实践过程中很容易产生一些列问题。
首先,这种方式显著增加了我们管理知识库的成本。 如果采用这种方式去分类知识,在知识库的体积不断增长,其下的子分类不断细化之后,你会发现,在记录笔记之前或之后,自己花在分类上的时间会越来越多,而这明显是本末倒置的——我们使用知识库,就是为了不再操心存储和记录,腾出时间来思考和理解,如果用到最后,我们还要花大部分时间在梳理分类上,每每耗费大量脑力去回忆笔记存放在哪里,而不是回忆笔记本身的内容,搭建知识库就失去了应有的意义和作用。
实际上,这种方法发展到最后,会变成一门图书管理和档案管理中的主要课程——图书分类法。
图书馆正是遵照这样的分类模式建立的,而其分类原则,无论是国际上的杜威十进制图书分类法,还是我国的中图法,都已经成了一本厚厚的专著,甚至复杂到需要本科教育中的课程去专门学习,如果按照这种方法做区分,后期的维护和启动成本一定会高昂到无法估量。
其次,这种区分会潜移默化中影响我们对知识的调用。 如果按照学科分类,很多笔记实际上会拥有许多重不同的学科特点,尤其是某些交叉学科领域,比如人类行为学。它既有心理学的特质,又有微观经济学的特质,甚至还涉及部分脑科学的知识,如果我今天做了一份人类行为学的笔记,它究竟应该存放在上述的某一门类下,还是复制好几份,分别存放在涉及的门类中?或是直接再新建一个单独的知识库来存放?
当然,在存储阶段,以上的方式似乎都问题不大,但不要忘记,知识库在参与进大脑的思考流程后,还会影响到我们的输出—— 到最后,你会发现,在这种区分模式下,无论我们如何存放,都无法避免对输出结果的影响。 举例来说,今天我要写一份人类行为学的报告,需要调用原先储存在知识库中文件作为参考。这时,假如你的相关文件存放在心理学知识库的下属门类中,你在调用这些知识时便会不由自主地更关注其涉及心理学的一面,而更容易忽视其他学科在这一领域的影响,而这份知识在你的库中,也很可能只会与心理学的相关内容连接,很难“跨库连接”……最后,你发现,用这些内容组织出来的,可能是一份心理学的报告,而不是人类行为学的报告。
当然,你可以在行为学涉及的门类中复制多份,同时存储,那么问题就变成了“如何找全每一份我记下来的知识”,随之而来的是工作量的成倍增加。
那如果我就单独建库存储呢?那么你的知识就被完全封闭在了这个单独的库中。放在某一门类下,至少还能将其融入不完整的网状或树状结构中,如果单独存储,这部分知识与你的组织结构就是完全相互独立的,根据前文的理论,与其他知识毫无连接的新知识,不仅难记,很可能也“难用”。
所以,这个问题的解决办法究竟是什么?通过标签分类也许是一个方案。不同标签之间的连接不易受层级隔离,多个标签在同一文件中的呈现也不受层级的桎梏,而含有同一标签的文件,也能再组织出形式更灵活的层级结构。当然,此处我的观点也只是抛砖引玉,可能还存在其他更好的解决方案也说不定,而那就有赖于读者自己去探索和总结了。
知识库的功能
前文我们提到,知识库的功能设计可以参照将短期记忆转化为长期记忆的可行方式来设计。其中,“简化+抽象”相对简单,很容易通过标签、关键词、概要等形式实现,我们着重看看其余两种实现方式。
- 间歇重复: 在知识库中,实现间歇重复主要分为两层:主动重复和被动重复,所谓主动重复,即需要某个知识时,通过检索或其他手段让知识快速复现。要实现良好的主动重复功能,知识库的搜索需要更“高级”——如:不仅支持标题搜索,还可能需要支持内容搜索、标签搜索、关键字搜索,以及一定程度的同义字词联想搜索等。被动重复的形式相对就更丰富,我们需要做的是让过去的笔记以某种形式自然复现。参考市面上的许多笔记 app,这种复现可以是“去年今日”、“最近笔记”、“随机漫步”等,只要满足“按照某种规则定期出现”即可。
- 建立连接: 落实到知识库中,这种连接应当出现在不同的笔记之间,在具体功能的体现上,笔记软件中对应的应该是“双向链接”、“标签”等,选择知识库工具时,可以优先选择具有这类功能的笔记软件。
除此之外,知识库还应具有的核心功能应当是辅助输出,这也是费曼学习法中最核心的观点——理解一个知识最简单的方式,就是用自己的话把它讲清楚。
知识库对于输出最大的帮助,应当是梳理知识之间的联系, 思考是网状结构的,而表达是树状的,因此,从知识库中梳理出一篇树状结构的文章大纲,就可以视为一种表达。
知识库的流程
学习从根本上来说是一件反人性的事情,持续做一件反人性的事情,其实相当不易。 如果此时,你面对的还是一个极尽复杂和繁琐的系统,你甚至会缺乏打开它的勇气。所以,我们在设计知识库的时候,应该保证各个环节尽量简单、高效、轻量化,降低“启动成本”,这样才能养成记录和使用知识库的习惯。
- 归于一处: 为了在检索时方便,应该尽量将同类的内容放在同一处, 不要用多种工具来做同一件事。 例如,今天把笔记记在备忘录里,明天记在纸上,后天记在知识库里。这样的记录,不仅无助于记忆,反而会让记忆变得更加困难和混乱。
- 借助自动化工具来让流程更简单: 多寻找规范化、批量化、自动化的解决方案,以此来代替某些重复型工作,短期内这些改动可能看不到什么收益,但当你要一次性记录或整理成百上千条笔记的时候,你会感谢现在的自己的。
知识库的激励机制
《游戏改变世界》一书中介绍过,“游戏化设计”的 4 个特点分别是: 有明确的目标、规则和良好的反馈系统,并且玩家需自愿参与。
如果从这个角度看的话,知识库正是针对学习的“游戏化设计”方案。
知识库要求我们完成某个目标(记录一个知识卡片)时,必要地进行刻意练习,游戏规则明确,就是学习完成后记录笔记。
而笔记本身是一种知识的可视化,强化了学习的反馈系统,同时知识也具有复利性,你学习到的知识越多,吸收新知识也就越简单,速度也越快。知识的复利效应让我们成功进入大脑和知识库同步成长的双正反馈循环中。除此之外,你也可以自行设计一些更视觉化、更直观、感知度更强的反馈方式:如:类似 github 主页的贡献热力图,或是以周、月等时间尺度展示的统计表、数据图,这将会强化在知识库中填充内容的获得感,加速正反馈循环的建立过程。
关于笔记工具的挑选
你可能已经注意到,这篇文章在写作过程中,尽量避免提及具体的工具,这是为了避免先入为主地陷入某类工具的思维——人的思维习惯会影响他们选择的工具,而使用的工具又会反过来影响他们的思维习惯。
你会发现,长期使用 word 编辑文档的人,往往习惯于先安排内容,再划分文章的结构,习惯使用 Markdown 编辑器的人则相反,文章的结构往往先于内容产生。至于使用更接近编程语言的 LaTeX 创作的人,习惯则又有所不同。
再例如习惯使用 Photoshop 的人,习惯将画布拆成图层,所有的处理都是基于图层发生,而习惯使用 figma 的人,脑海里则不会有图层的概念,他们习惯将画布拆成画面、矩形、线条等元素,画面的处理依赖对元素的编辑。
这些习惯其实正是不同思维方式的体现,而习惯的改变很可能也体现出一个人思维方式的变化,因此,从一种工具换到另一种工具,可能意味着你得习惯一套完全不同的工作流和处理逻辑,这最终将影响到你现有的思维。
因此,在选择构建知识库时,我们提倡选择更符合自己思维的工具,按照本文所述,这款工具至少需要满足以下要求:
- 有双向链接和标签功能——用于关联知识
- 检索功能足够强大——有利于主动复现和知识调用
- 支持功能拓展或可编程——能够实现让笔记以某种规律间歇重复
- 流程简单、自动化程度高——降低使用门槛
选择有很多,这里不展开叙述,几款市占率比较高的笔记软件,如 Notion、Obsidian、Roam、Logseq 等都基本能满足上述需求,至于其他如印象笔记等以笔记本为本位的笔记软件,其记录模式已经过时,不建议选择。
如果你还没有一个知识库工具,我的建议是可以试用上述几款高市占率软件,挑选适合你的一款。另外,选择笔记时,应该尽量从长考虑,因为笔记系统之间的迁移成本非常高,如果使用一段时间后发现现有的工具不满足自己的需求,应该及时提出问题并纠正。
这篇文章到这里,篇幅已经十分可观,因此,依托某款笔记软件搭建知识库的实例教程,只能 挖坑 分割,留待有机会再做书写。
以上是文章的全部内容,感谢有耐心阅读到这里的读者。如果对建立知识库有任何问题,欢迎留言讨论。 就是指不定我什么时候能看见罢了。