跳转至

The Role of System 1 and System 2 Semantic Memory Structure in Human and LLM Biases

论文基本信息

  • 作者: Katherine Abramski, Giulio Rossetti, Massimo Stella
  • arXiv: https://arxiv.org/abs/2604.12816
  • 领域: cs.AI, cs.HC

摘要

人类和大型语言模型中的隐性偏见带来重大社会风险。双过程理论认为偏见主要来自联想型 System 1 思维,而反思型 System 2 思维可以减轻偏见,但产生这种二元性的认知机制仍不清楚。论文通过语义记忆结构分析人类和 LLM 偏见的机制。研究发现人类和 LLM 的偏见都与语义记忆中的特定结构模式相关,System 1 偏见可以通过记忆结构干预来减轻。

核心贡献

  1. Semantic Memory × Bias: 首次系统研究语义记忆结构与偏见的关系
  2. System 1/2 Memory Mapping: 发现 System 1 和 System 2 偏见对应的不同记忆结构
  3. Human-LLM Comparison: 人类和 LLM 偏见机制的异同分析
  4. Memory Structure Intervention: 通过记忆结构干预减轻偏见的可行性
  5. Cognitive Framework: 为理解和缓解 AI 偏见提供认知框架

研究背景与问题

AI 偏见研究通常关注输出偏差,缺乏对内在认知机制的深入分析。理解偏见如何与记忆结构相互作用,对构建更公平的 Agent 系统至关重要。

核心方法

  1. Semantic Memory Network: 建模人类和 LLM 的语义记忆网络结构
  2. Bias Detection in Memory: 在记忆结构中识别偏见模式
  3. System 1/2 Activation Simulation: 模拟 System 1 和 System 2 的激活模式
  4. Intervention Simulation: 测试不同记忆结构干预对偏见的影响

为什么重要

该研究为 Agent 记忆系统的偏见问题提供了认知科学视角。理解 System 1/2 偏见对应的记忆结构,可以指导 Agent 记忆系统的设计和偏见缓解策略。

与移动端/端侧相关性

  1. 端侧偏见问题: 移动端 Agent 的偏见会直接影响用户体验
  2. 本地记忆偏见: 端侧个性化记忆可能加剧偏见
  3. 记忆结构干预: 移动端可以通过调整记忆结构减轻偏见
  4. 隐私保护: 语义记忆分析涉及隐私,边缘部署更安全