The Role of System 1 and System 2 Semantic Memory Structure in Human and LLM Biases¶
论文基本信息¶
- 作者: Katherine Abramski, Giulio Rossetti, Massimo Stella
- arXiv: https://arxiv.org/abs/2604.12816
- 领域: cs.AI, cs.HC
摘要¶
人类和大型语言模型中的隐性偏见带来重大社会风险。双过程理论认为偏见主要来自联想型 System 1 思维,而反思型 System 2 思维可以减轻偏见,但产生这种二元性的认知机制仍不清楚。论文通过语义记忆结构分析人类和 LLM 偏见的机制。研究发现人类和 LLM 的偏见都与语义记忆中的特定结构模式相关,System 1 偏见可以通过记忆结构干预来减轻。
核心贡献¶
- Semantic Memory × Bias: 首次系统研究语义记忆结构与偏见的关系
- System 1/2 Memory Mapping: 发现 System 1 和 System 2 偏见对应的不同记忆结构
- Human-LLM Comparison: 人类和 LLM 偏见机制的异同分析
- Memory Structure Intervention: 通过记忆结构干预减轻偏见的可行性
- Cognitive Framework: 为理解和缓解 AI 偏见提供认知框架
研究背景与问题¶
AI 偏见研究通常关注输出偏差,缺乏对内在认知机制的深入分析。理解偏见如何与记忆结构相互作用,对构建更公平的 Agent 系统至关重要。
核心方法¶
- Semantic Memory Network: 建模人类和 LLM 的语义记忆网络结构
- Bias Detection in Memory: 在记忆结构中识别偏见模式
- System 1/2 Activation Simulation: 模拟 System 1 和 System 2 的激活模式
- Intervention Simulation: 测试不同记忆结构干预对偏见的影响
为什么重要¶
该研究为 Agent 记忆系统的偏见问题提供了认知科学视角。理解 System 1/2 偏见对应的记忆结构,可以指导 Agent 记忆系统的设计和偏见缓解策略。
与移动端/端侧相关性¶
- 端侧偏见问题: 移动端 Agent 的偏见会直接影响用户体验
- 本地记忆偏见: 端侧个性化记忆可能加剧偏见
- 记忆结构干预: 移动端可以通过调整记忆结构减轻偏见
- 隐私保护: 语义记忆分析涉及隐私,边缘部署更安全