实现最小意识模型--4 自我模型和世界模型
3.2自我模型和世界模型
我们在这里归类的模型都有一个共同的想法,那就是,对于一个有意识的事物来说,这个事物必须能够塑造它自己和它的世界:换句话说,有意识就是成为那种参与情境自我塑造的事物。这组理论包括综合世界建模理论(Safron,2020a,2020b,2021a,2022a,2022bSafron,atal,& Tim,2022),自我建模理论(Metzinger,2007),beast machine方法(Seth & Tsakiris,2018),生成纠缠模型(Clark,2019),感觉不确定性理论(Solms,2013),以及投射意识模型(Rudrauf等人,2017;威利福德等人,2018)。基于高阶表征的意识理论,如高阶思维(HOT) (R. Brown,Lau,& LeDoux,2019;Rosenthal,2005)和高阶知觉(Lycan,1996)理论,以及各种自我表征主义(Kriegel & Williford,2006),阐明了基于自我建模的意识观点的重要概念基础和动机。
3.2.1整合世界建模理论
在最近关于内部屏幕模型的工作之前(Ramstead等人,2023年),集成世界建模理论(IWMT) (Safron,2020a,2020b,2021a,2022a,2022bSafron,atal和Tim,2022)可能是最全面的尝试,以确定现存意识理论下的“大象”。IWMT可以说是提供MUM的第一次尝试对于以FEP为前提的意识理论来说,尽管这个术语是由(Wiese,2020)引入的。因此,所提出的MUM可以被视为生成类似IWMT的模型的尝试,尽管该模型具有更少的理论假设集,专注于意识体验所必需的核心组件,并进一步描述如何从其他理论中找到趋同支持。
根据IWMT的观点,意识是一个整合世界模型的过程。更确切地说,意识将对应于正在进行的关于被体现的主体的可能感觉状态的推论或预测的产生;这些推论是以因果世界模型为条件的,而因果世界模型又是从生态位内的目标追求历史中训练出来的。这一理论的前提是认知系统被赋予了特定的世界建模能力。这些世界模型具有空间、时间和因果的一致性。更具体地说,IWMT声称意识依赖于经验的组织,根据康德的空间(或局部性,因此提供关于特定属性的组合性)、时间(或空间中的比例变化,因此提供预测)和原因(或这些变化中足以提供建模/结构学习的规律性)。这些形成一致性的特性可能进一步需要依赖于(并允许)学习和部署以自我为中心的、前瞻性的参考框架以及对反事实可能性的评估的各种形式的代理,从而提供作为“生活世界”上的“观点”的主观性。根据IWMT的观点,意识是一个能够产生身体和世界的整合的、连贯的表示的过程,其中世界建模的过程协同地整合了给定主体可用的和相关的各种信息源。这些综合表征允许智能体以足够的速度生成对智能体世界配置的一致估计,使得智能体能够在形成的时间尺度上通过行动-感知循环来通知和被通知。就IWMT而言,这使得适应性行动选择成为可能——广义地解释为包括关于精神行为的政策部署(Safron,2021 a)——以及这些政策和世界模型的迭代改进(参见终身学习)。
IWMT提出,信息整合或压缩/预测(Safron,2022a)是通过一种机制来促进的,这种机制涉及被称为“自组织谐波模式”(SOHMs)的动态吸引子的形成和失效。SOHMs代表了赛仑·阿塔索伊的“连接体谐波”方法的概括,通过识别谐波函数或粗粒化来模拟神经成像数据(阿塔索伊、唐纳利和皮尔森,2016年)动力学的驻波描述——关于在大脑白质拓扑的拉普拉斯图上传播活动的模拟,特定的精神状态被表征为这些进化基函数的各种组合。(SOHMs的结构有效性不依赖于任何给定分析技术的有效性;SOHMs同样与利用总体几何(Pang et al .,2023)而非大脑连接特征的方法兼容。作为同步流形的功能,SOHMs被建议为它们形成的子网生成联合信念,信念传播——参见边际消息传递(Parr,Markovic等人,2019)——通过一致性通信原理(Fries,2005)来促进。也就是说,
通过允许神经元群在其各自的整合窗口内交换信息,同步被建议提供更复杂的相干神经信号模式。此外,每个SOHM都被建议作为一种工作空间(在GWT建议的计算意义上),允许跨尺度的信息集成。这些嵌套的谐波模式进一步被建议为具有不同程度的时间深度的生成模型的部署提供基础,具有分层相关(感觉解耦)的SOHMs提供反事实观察和信念的生成(取决于特定的行动过程)。
sohm被认为是以显示可分解性(或组合性)程度的方式分层(或异质)构造的,较小规模的sohm模拟更快速演变的事件,但是可以组合成越来越大的sohm,用于越来越复杂形式的自我和世界模拟。因此,SOHMs依赖于耦合神经集成展现共振的能力(参见Hopfield网络和restricted Boltzmann machines),这是指耦合系统通过调整其动态以收敛于共享同步流形来最小化其*能的现象(Friston & Frith,2015;卡奇曼,欧文&英格兰,2017;Palacios等人,2019年)。抽象地说,SOHMs也可以理解为多分辨率小波分析的一种形式,用于灵活地建模(从而能够管理)多尺度过程,例如代理和他们追求有价值目标的各种环境。
根据IWMT的说法,如果足够复杂和连贯的建模可以通过以自我为中心的参考框架的多模态集成来实现——被认为是由后内侧皮质和他们接收的头部方向信息部分实现的——那么代理人可能能够迭代地估计他们感觉状态的最可能原因,从而实现根据“生活世界”的观点组织的经验流。根据IWMT的解释,这些共振的活动模式产生了一个组合的自我和世界模型,当下降的预测与上升的期望相协调时,能够产生适应性的推理模式。更复杂的自我模型和各种形式的“有意识的接触”被提出来要求与额叶皮质耦合,以便这些估计以具有更大时间深度和反事实丰富性的因果世界模型为条件,特别是被引导到公开和隐蔽行动的轨迹中(Safron,2021a萨夫龙,阿塔尔和蒂姆,2022年)。
IWMT可以理解为G(N)WT的贝叶斯版本。然而,IWMT与GNWT的不同之处在于,它致力于具有不同范围和功能的多种工作空间的概念,包括由SOHMs实现的次个人的、无意识的本地模型。IWMT提出了两种主要的工作空间形式(两者都以中间层次的表征为中心):一种工作空间被假设为由后皮层实现,因此允许对公开和隐蔽动作选择进行迭代状态估计;另一个工作空间包括更广泛的(例如,额叶相关的)整合区域,因此允许这些系统世界估计以具有有意(内源性)注意力选择和各种形式的有意识进入的能力的高级策略为条件,包括关于通过预测和预测进行想象力规划的“精神时间旅行”(Safron,2020b,2021a萨夫龙,阿塔尔和蒂姆,2022年)。
IWMT为GNWT提供了一个关键的视角,表明后皮质可能具有足够的能力来整合自我和世界建模的信息,因此它们可以被认为是现象意识的充分实现者和相当“全球性”的工作空间。此外,根据注意图式和意识的高阶理论,IWMT认为主观体验(即“感觉是什么样的”)对应于一种关于个人感觉原因的特定信念,这种信念将受到通过公开和隐蔽行动的各种形式的有意识和无意识访问的严重影响(Safron,2020a,2021a,2022b)。也就是说,虽然IWMT保持了现象意识和有意识接近之间的分离,但它也承认这些现象之间存在广泛的相互作用,使得它们难以单独分析和概念化(无论是在实践中还是在原则上)。
此外,IWMT将GWT点火事件中涉及的相变比作“波函数坍缩”(Safron,2022b),此时临界质量的(相对)密集相互作用的元素形成了一个连贯运行的动态核心。由于这个核心之外的神经集合缺乏对这个更具包容性(和丰富整合性)的SOHM的密集和相互作用元素的访问,通过自我强化和自我组织模式建立SOHM支持的工作空间可以被认为是压缩或粗粒化网络内的信息。这样,促成点火事件的非线性渗透活动可以被比作信息“奇点”的形成,其中每个SOHM范围内的元素对于外部观察者(即,其他sohm)可能变得难以辨认。因此,后者必须根据可以跨越这些子系统的边界传输的任何信息,推断出其他SOHMS中“主体”的(压缩)内容。
像下面回顾的几个理论(特别是野兽机器方法和感觉不确定性理论),IWMT与具身心智理论密切相关(Safron,2021a瓦雷拉、汤普森和罗什,2017年)。IWMT的支持者认为,IWMT所包含的那种世界建模只可能存在于具体化的主体中——也就是说,主体被赋予了物理身体的物理和几何形状,并受其约束。因此,世界建模所需的整合包括控制,提供了将感觉系统导向世界的方法。与我们目前的建议一致,IWMT声称,身体和本体感受生成模型的面向动作的表示可能构成工作空间动力学的“支柱”,根据相关的启示构建所有感知,并通过隐蔽的动作提供有意控制注意力选择的来源(Safron,2021a)。在整合体现、自上而下的注意和意志、有意的控制,并致力于建立一种易于解释各种形式的意识进入和自我意识的理论时,IWMT旨在提供一种协同的和包容的(尽管在易于理解方面可能过于包容)解释,说明意识是如何从这些过程的动态相互作用中产生的,并旨在提供一种关于意识体验和自我意识的本质的统一观点。
上一篇: 基于 DETR 的开放世界目标检测 - 从入门到精通
下一篇: 人类小脑的功能连接组学
推荐阅读
-
正负偏差变量 即 d2+、d2- 分别表示决策值中超出和未达到目标值的部分。而 di+、di- 均大于 0 刚性约束和目标约束(柔性目标约束有偏差) 在多目标规划中,>=/<= 在刚性约束中保持不变。当需要将约束条件转换为柔性约束条件时,需要将 >=/<= 更改为 =(因为已经有 d2+、d2- 用来表示正负偏差),并附加上 (+dii-di+) 注意这里是 +di、-di+!之所以是 +di,-di+,是因为需要将目标还原为最接近的原始刚性约束条件 优先级因素和权重因素 对多个目标进行优先排序和优先排序 目标规划的目标函数 是所有偏差变量的加权和。值得注意的是,这个加权和都取最小值。而 di+ 和 dii- 并不一定要出现在每个不同的需求层次中。具体分析需要具体问题具体分析 下面是一个例子: 题目中说设备 B 既要求充分利用,又要求尽可能不加班,那么列出的时间计量表达式即为:min z = P3 (d3- + d3 +) 使用 + 而不是 -d3 + 的原因是:正负偏差不可能同时存在,必须有 di+di=0 (因为判定值不可能同时大于目标值和小于目标值),而前面是 min,所以只要取 + 并让 di+ 和 dii- 都为正值即可。因此,得出以下规则: 最后,给出示例和相应的解法: 问题:某企业生产 A 和 B 两种产品,需要使用 A、B、C 三种设备。下表显示了与工时和设备使用限制有关的产品利润率。问该企业应如何组织生产以实现下列目标? (1) 力争利润目标不低于 1 500 美元; (2) 考虑到市场需求,A、B 两种产品的生产比例应尽量保持在 1:2; (3)设备 A 是贵重设备,严禁超时使用; (4)设备 C 可以适当加班,但要控制;设备 B 要求充分利用,但尽量不加班。 从重要性来看,设备 B 的重要性是设备 C 的三倍。 建立相应的目标规划模型并求解。 解:设企业生产 A、B 两种产品的件数分别为 x1、x2,并建立相应的目标计划模型: 以下为顺序求解法,利用 LINGO 求解: 1 级目标: 模型。 设置。 variable/1..2/:x;! s_con_num/1...4/:g,dplus,dminus;!所需软约束数量(g=dplus=dminus 数量)及相关参数; s_con(s_con_num);! s_con(s_con_num,variable):c;!软约束系数; 结束集 数据。 g=1500 0 16 15. c=200 300 2 -1 4 0 0 5; 结束数据 min=dminus(1);!第一个目标函数;!对应于 min=z 的第一小部分;! 2*x(1)+2*x(2)<12;!硬约束 @for(s_con_num(i):@sum(variable(j):c(i,j)*x(j))+dminus(i)-dplus(i)=g(i)); !使用设置完成的数据构建软约束表达式; ! !软约束表达式 @for(variable:@gin(x)); !将变量约束为整数; ! 结束 此时,第一级目标的最优值为 0,第一级偏差为 0: 第二级目标: !求 dminus(1)=0,然后求解第二级目标。 模型。 设置。 变量/1..2/:x;!设置:变量/1..2/:x; ! s_con_num/1...4/:g,dplus,dminus;!软约束数量及相关参数; s_con(s_con_num(s_con_num));! s_con(s_con_num,variable):c;! 软约束系数; s_con(s_con_num,variable):c;! 结束集 数据。 g=1500 0 16 15; c=200 300 2 -1 4 0 0 5; 结束数据 min=dminus(2)+dplus(2);!第二个目标函数 2*x(1)+2*x(2)<12;!硬约束 @for(s_con_num(i):@sum(variable(j):c(i,j)*x(j))+dminus(i)-dplus(i)=g(i)); ! 软约束表达式;! dminus(1)=0; !第一个目标结果 @for(variable:@gin(x)); ! 结束 此时,第二个目标的最优值为 0,偏差为 0: 第三目标 !求 dminus(2)=0,然后求解第三个目标。 模型。 设置。 变量/1..2/:x;!设置:变量/1..2/:x; ! s_con_num/1...4/:g,dplus,dminus;!软约束数量及相关参数; s_con(s_con_num(s_con_num));! s_con(s_con_num,variable):c;! 软约束系数; s_con(s_con_num,variable):c;! 结束集 数据。 g=1500 0 16 15; c=200 300 2 -1 4 0 0 5; 结束数据 min=3*dminus(3)+3*dplus(3)+dminus(4);!第三个目标函数。 2*x(1)+2*x(2)<12;!硬约束 @for(s_con_num(i):@sum(variable(j):c(i,j)*x(j))+dminus(i)-dplus(i)=g(i)); ! 软约束表达式;! dminus(1)=0; !第一个目标约束条件; ! dminus(2)+dplus(2)=0; !第二个目标约束条件 @for(variable:@gin(x));! 结束 最终结果为 x1=2,x2=4,dplus(1)=100,最优利润为
-
实现最小意识模型--4 自我模型和世界模型
-
利用 bitsandbytes、4 位量化和 QLoRA 创建经济实惠的 LLM-QLoRA,通过量化实现大模型*度的新方法
-
小红书大产品部架构 小红书产品概览--经过性能、稳定性、成本等多个维度的详细评估,小红书最终决定选择基于腾讯云星海自研硬件的SA2云服务器作为主力机型使用。结合其秒级的快速扩缩、超强兼容和平滑迁移能力,小红书在抵御上亿次用户访问、保证系统稳定运行的同时,也实现了成本的大幅降低。 星海SA2云服务器是基于腾讯云星海的首款自研服务器。腾讯云星海作为自研硬件品牌,通过创新的高兼容性架构、简洁可靠的自主设计,结合腾讯自身业务以及百万客户上云需求的特点,致力于为云计算时代提供安全、稳定、性能领先的基础架构产品和服务。如今,星海SA2云服务器也正在为越来越多的企业提供低成本、高效率、更安全的弹性计算服务。 以下是与小红书SRE总监陈敖翔的对话实录。 问:请您介绍一下小红书及其主要商业模式? 小红书是一个面向年轻人的生活方式平台,在这里,他们发现了向上、多元的真实世界。小红书日活超过 3500 万,月活跃用户超过 1 亿,日均笔记曝光量达 80 亿。小红书由社交平台和在线购物两大部分组成。与其他线上平台相比,小红书的内容基于真实的口碑分享,播种不止于线上,还为线下实体店赋能。 问:围绕业务发展,小红书的系统架构经历了怎样的变革和演进? 系统架构变化不大,影响最深的是资源开销。过去三年,资源开销大幅增加,同比增长约 10 倍。在此背景下,我们努力进行优化,包括很早就开始使用 K8S 进行资源调度。到 18 年年中,绝大多数服务已经完全实现了容器化。 问:目前小红书系统架构中的计算基础设施建设和布局是怎样的? 我们目前的建设方式可以简单描述为星型结构。腾讯云在上海的一个区是我们的计算中心,承载着我们的核心数据和在线业务。在外围,我们还有两个数据中心进行计算分流,同时承担灾备和线上业务双活的角色。 与其他新兴电子商务互联网公司类似,小红书的大部分计算能力主要用于线下数据分析、模型训练和在线推荐等平台。随着业务的发展,对算力的需求也在加速增长。
-
实战体验Deeplearning4j:用Java实现数字图像识别和模型训练的分布式神经网络库