实现最小意识模型--4 自我模型和世界模型

最编程 2024-04-19 12:16:00

...

3.2自我模型和世界模型

我们在这里归类的模型都有一个共同的想法，那就是，对于一个有意识的事物来说，这个事物必须能够塑造它自己和它的世界:换句话说，有意识就是成为那种参与情境自我塑造的事物。这组理论包括综合世界建模理论(Safron，2020a，2020b，2021a，2022a，2022bSafron，atal，& Tim，2022)，自我建模理论(Metzinger，2007)，beast machine方法(Seth & Tsakiris，2018)，生成纠缠模型(Clark，2019)，感觉不确定性理论(Solms，2013)，以及投射意识模型(Rudrauf等人，2017；威利福德等人，2018)。基于高阶表征的意识理论，如高阶思维(HOT) (R. Brown，Lau，& LeDoux，2019；Rosenthal，2005)和高阶知觉(Lycan，1996)理论，以及各种自我表征主义(Kriegel & Williford，2006)，阐明了基于自我建模的意识观点的重要概念基础和动机。

3.2.1整合世界建模理论

在最近关于内部屏幕模型的工作之前(Ramstead等人，2023年)，集成世界建模理论(IWMT) (Safron，2020a，2020b，2021a，2022a，2022bSafron，atal和Tim，2022)可能是最全面的尝试，以确定现存意识理论下的“大象”。IWMT可以说是提供MUM的第一次尝试对于以FEP为前提的意识理论来说，尽管这个术语是由(Wiese，2020)引入的。因此，所提出的MUM可以被视为生成类似IWMT的模型的尝试，尽管该模型具有更少的理论假设集，专注于意识体验所必需的核心组件，并进一步描述如何从其他理论中找到趋同支持。

根据IWMT的观点，意识是一个整合世界模型的过程。更确切地说，意识将对应于正在进行的关于被体现的主体的可能感觉状态的推论或预测的产生；这些推论是以因果世界模型为条件的，而因果世界模型又是从生态位内的目标追求历史中训练出来的。这一理论的前提是认知系统被赋予了特定的世界建模能力。这些世界模型具有空间、时间和因果的一致性。更具体地说，IWMT声称意识依赖于经验的组织，根据康德的空间(或局部性，因此提供关于特定属性的组合性)、时间(或空间中的比例变化，因此提供预测)和原因(或这些变化中足以提供建模/结构学习的规律性)。这些形成一致性的特性可能进一步需要依赖于(并允许)学习和部署以自我为中心的、前瞻性的参考框架以及对反事实可能性的评估的各种形式的代理，从而提供作为“生活世界”上的“观点”的主观性。根据IWMT的观点，意识是一个能够产生身体和世界的整合的、连贯的表示的过程，其中世界建模的过程协同地整合了给定主体可用的和相关的各种信息源。这些综合表征允许智能体以足够的速度生成对智能体世界配置的一致估计，使得智能体能够在形成的时间尺度上通过行动-感知循环来通知和被通知。就IWMT而言，这使得适应性行动选择成为可能——广义地解释为包括关于精神行为的政策部署(Safron，2021 a)——以及这些政策和世界模型的迭代改进(参见终身学习)。

IWMT提出，信息整合或压缩/预测(Safron，2022a)是通过一种机制来促进的，这种机制涉及被称为“自组织谐波模式”(SOHMs)的动态吸引子的形成和失效。SOHMs代表了赛仑·阿塔索伊的“连接体谐波”方法的概括，通过识别谐波函数或粗粒化来模拟神经成像数据(阿塔索伊、唐纳利和皮尔森，2016年)动力学的驻波描述——关于在大脑白质拓扑的拉普拉斯图上传播活动的模拟，特定的精神状态被表征为这些进化基函数的各种组合。(SOHMs的结构有效性不依赖于任何给定分析技术的有效性；SOHMs同样与利用总体几何(Pang et al .，2023)而非大脑连接特征的方法兼容。作为同步流形的功能，SOHMs被建议为它们形成的子网生成联合信念，信念传播——参见边际消息传递(Parr，Markovic等人，2019)——通过一致性通信原理(Fries，2005)来促进。也就是说，

通过允许神经元群在其各自的整合窗口内交换信息，同步被建议提供更复杂的相干神经信号模式。此外，每个SOHM都被建议作为一种工作空间(在GWT建议的计算意义上)，允许跨尺度的信息集成。这些嵌套的谐波模式进一步被建议为具有不同程度的时间深度的生成模型的部署提供基础，具有分层相关(感觉解耦)的SOHMs提供反事实观察和信念的生成(取决于特定的行动过程)。

sohm被认为是以显示可分解性(或组合性)程度的方式分层(或异质)构造的，较小规模的sohm模拟更快速演变的事件，但是可以组合成越来越大的sohm，用于越来越复杂形式的自我和世界模拟。因此，SOHMs依赖于耦合神经集成展现共振的能力(参见Hopfield网络和restricted Boltzmann machines)，这是指耦合系统通过调整其动态以收敛于共享同步流形来最小化其*能的现象(Friston & Frith，2015；卡奇曼，欧文&英格兰，2017；Palacios等人，2019年)。抽象地说，SOHMs也可以理解为多分辨率小波分析的一种形式，用于灵活地建模(从而能够管理)多尺度过程，例如代理和他们追求有价值目标的各种环境。

根据IWMT的说法，如果足够复杂和连贯的建模可以通过以自我为中心的参考框架的多模态集成来实现——被认为是由后内侧皮质和他们接收的头部方向信息部分实现的——那么代理人可能能够迭代地估计他们感觉状态的最可能原因，从而实现根据“生活世界”的观点组织的经验流。根据IWMT的解释，这些共振的活动模式产生了一个组合的自我和世界模型，当下降的预测与上升的期望相协调时，能够产生适应性的推理模式。更复杂的自我模型和各种形式的“有意识的接触”被提出来要求与额叶皮质耦合，以便这些估计以具有更大时间深度和反事实丰富性的因果世界模型为条件，特别是被引导到公开和隐蔽行动的轨迹中(Safron，2021a萨夫龙，阿塔尔和蒂姆，2022年)。

IWMT可以理解为G(N)WT的贝叶斯版本。然而，IWMT与GNWT的不同之处在于，它致力于具有不同范围和功能的多种工作空间的概念，包括由SOHMs实现的次个人的、无意识的本地模型。IWMT提出了两种主要的工作空间形式(两者都以中间层次的表征为中心):一种工作空间被假设为由后皮层实现，因此允许对公开和隐蔽动作选择进行迭代状态估计；另一个工作空间包括更广泛的(例如，额叶相关的)整合区域，因此允许这些系统世界估计以具有有意(内源性)注意力选择和各种形式的有意识进入的能力的高级策略为条件，包括关于通过预测和预测进行想象力规划的“精神时间旅行”(Safron，2020b，2021a萨夫龙，阿塔尔和蒂姆，2022年)。

IWMT为GNWT提供了一个关键的视角，表明后皮质可能具有足够的能力来整合自我和世界建模的信息，因此它们可以被认为是现象意识的充分实现者和相当“全球性”的工作空间。此外，根据注意图式和意识的高阶理论，IWMT认为主观体验(即“感觉是什么样的”)对应于一种关于个人感觉原因的特定信念，这种信念将受到通过公开和隐蔽行动的各种形式的有意识和无意识访问的严重影响(Safron，2020a，2021a，2022b)。也就是说，虽然IWMT保持了现象意识和有意识接近之间的分离，但它也承认这些现象之间存在广泛的相互作用，使得它们难以单独分析和概念化(无论是在实践中还是在原则上)。

此外，IWMT将GWT点火事件中涉及的相变比作“波函数坍缩”(Safron，2022b)，此时临界质量的(相对)密集相互作用的元素形成了一个连贯运行的动态核心。由于这个核心之外的神经集合缺乏对这个更具包容性(和丰富整合性)的SOHM的密集和相互作用元素的访问，通过自我强化和自我组织模式建立SOHM支持的工作空间可以被认为是压缩或粗粒化网络内的信息。这样，促成点火事件的非线性渗透活动可以被比作信息“奇点”的形成，其中每个SOHM范围内的元素对于外部观察者(即，其他sohm)可能变得难以辨认。因此，后者必须根据可以跨越这些子系统的边界传输的任何信息，推断出其他SOHMS中“主体”的(压缩)内容。

像下面回顾的几个理论(特别是野兽机器方法和感觉不确定性理论)，IWMT与具身心智理论密切相关(Safron，2021a瓦雷拉、汤普森和罗什，2017年)。IWMT的支持者认为，IWMT所包含的那种世界建模只可能存在于具体化的主体中——也就是说，主体被赋予了物理身体的物理和几何形状，并受其约束。因此，世界建模所需的整合包括控制，提供了将感觉系统导向世界的方法。与我们目前的建议一致，IWMT声称，身体和本体感受生成模型的面向动作的表示可能构成工作空间动力学的“支柱”，根据相关的启示构建所有感知，并通过隐蔽的动作提供有意控制注意力选择的来源(Safron，2021a)。在整合体现、自上而下的注意和意志、有意的控制，并致力于建立一种易于解释各种形式的意识进入和自我意识的理论时，IWMT旨在提供一种协同的和包容的(尽管在易于理解方面可能过于包容)解释，说明意识是如何从这些过程的动态相互作用中产生的，并旨在提供一种关于意识体验和自我意识的本质的统一观点。

上一篇：基于 DETR 的开放世界目标检测 - 从入门到精通

下一篇：人类小脑的功能连接组学

实现最小意识模型--4 自我模型和世界模型

实现最小意识模型--4 自我模型和世界模型

利用 bitsandbytes、4 位量化和 QLoRA 创建经济实惠的 LLM-QLoRA，通过量化实现大模型*度的新方法

实战体验Deeplearning4j：用Java实现数字图像识别和模型训练的分布式神经网络库