llama.cpp b8837¶

基本信息¶

此版本在 ggml-backend-meta 中新增了 get_tensor 的多段读取（multi-segment read）支持（PR #22063）。

这改进了元数据后端的张量获取机制，允许从多个数据段中读取张量数据，对于分段存储的模型文件更加高效。

持续的后端改进确保了 llama.cpp 在各种平台（特别是 iOS/Android）上的模型加载效率。多段读取支持对于移动设备上常见的分段下载/存储策略尤其有价值。