算法适配与AMP机制的交互性能表现

【论文总结-联邦学习】Personalized Cross-Silo Federated Learning...

《Personalized Cross-Silo Federated Learning on Non-IID Data》提出了一种针对跨孤岛联邦学习中non-IID数据场景的个性化协作方法，通过联邦注意力信息传递机制（FedAMP）和启发式扩展（HeurFedAMP）提升模型性能，并在凸和非凸模型上验证了收敛性，实验表明其在用户数据分布差异明显的场景下效果显著。研究背景与问题提出联邦学习在独立同分布（IID）数据下表现良好，但实际应用中用户数据常呈现非独立同分布（non-IID）特征。传统全局协作方法忽略个体数据差异，导致模型性能下降。本文聚焦跨孤岛（cross-silo）场景，提出新算法促进相似数据用户间的协作，解决non-IID数据下的联邦学习挑战。方法创新与核心算法1. FedAMP算法目标函数构建：通过引入注意力机制，将个性化联邦学习问题建模为以下优化目标：其中，前半部分为用户损失函数之和，后半部分为注意力机制项，通过非线性函数 $ A(cdot) $ 度量模型参数差异（如负指数函数 $ A(x)=1-e^{-x/sigma} $）。优化步骤：梯度下降阶段：计算中间参数 $ U^k $，通过注意力机制调整相似用户间的协作强度：临近点法阶段：结合二次正则化优化最终参数 $ W^k $，平衡模型接近性与损失值：参数更新规则：通过注意力权重 $ xi_{i,j} $ 整合相似用户参数，确保距离越近的模型影响越大：其中 $ A'(x) $ 递减特性保证了协作的局部性。2. HeurFedAMP算法针对高维数据计算复杂度高的问题，HeurFedAMP简化注意力优化，直接通过余弦相似度整合用户参数：该方法放弃优化注意力函数，直接基于参数相似性进行协作，降低计算开销。实验设计与结果分析1. 数据集与评估指标数据类型：Pathological non-IID：随机合成两种类型样本的数据。Practical non-IID：用户分组后合成多类型样本，同组用户数据分布相似。评估指标：以通信轮次中的最佳平均测试准确率（BMTA）衡量模型性能。2. 实验结果不同数据类型对比：在Practical non-IID数据下，FedAMP和HeurFedAMP均显著优于传统方法，证明其对相似用户协作的促进作用。测试准确率比例：两种方法在用户数据类别区分明显的场景下表现优异，HeurFedAMP在计算效率上更具优势。结论与启示本文提出的FedAMP和HeurFedAMP算法通过注意力机制或相似性整合，有效提升了跨孤岛联邦学习在non-IID数据下的性能。实验表明，在用户数据分布差异显著的场景中，促进同类用户协作是提升模型泛化能力的关键。未来工作可进一步探索动态注意力调整或轻量化设计，以适应更复杂的实际应用需求。

nginx