跳转至

📱 Mobile AIOS Wiki

知识图谱

YueLich/aios-wiki

🗺️ 知识图谱总览¶

Mobile AIOS 知识库中所有实体和概念的关系网络。

核心主题¶

推理与部署¶

[[mnn-350]] — 阿里端侧推理引擎
[[llamacpp]] / [[ggml-llamacpp-hf]] — llama.cpp 生态
[[gemma-cpp-inference]] — Gemma C++ 推理
[[coremltools-9]] — Apple 模型转换
[[edgeflow-cold-start]] — 冷启动优化
[[react-native-llm-edge]] — 跨平台推理

模型¶

[[gemma4-ondevice]] — Google 端侧多模态
[[gemini-flash-live]] — 实时音频 AI
[[minicpm-242]] — 面壁端侧模型
[[qwen35-small]] — 千问端侧系列

Agent 系统¶

[[clawmobile-agentic]] — 分层架构，确定性优先（EuroMLSys 2026）
[[secagent-mobile-gui]] — 语义增强 GUI Agent
[[mga-memory-gui-agent]] — 记忆驱动 Agent
[[gui-agent-privacy]] — 隐私保护
[[pspa-bench-gui-agent]] — 个性化评估
[[turing-test-mobile-gui]] — 拟人化评估

优化技术¶

[[kv-cache-quantization-ondevice]] — KV-Cache 优化
[[septq-post-training-quantization]] — 后训练量化
[[lcsb-finetuning-ondevice]] — 端侧微调
[[multimodal-edge-pruning]] — 零样本剪枝

应用¶

[[mana-mobile-ad-detection]] — 广告检测
[[melotune-ondevice-music]] — 音乐推荐
[[facelivtv2-mobile-face]] — 人脸识别
[[fastshade-mobile-denoising]] — 图像去噪
[[sense-less-infer-more]] — 边缘医疗

关键关系¶

推理框架 ←→ 模型 ←→ Agent ↑ ↑ ↑ 硬件协同量化优化评估基准

推理框架 为模型提供运行时
Agent 依赖 推理框架 执行
优化技术 贯穿全栈
评估基准 验证系统

趋势¶

确定性 + 概率性协同成为共识
KV-Cache 量化是端侧推理关键瓶颈
GUI Agent 从实验室走向真实设备
隐私保护变为核心设计约束