《Personalized Cross-Silo Federated Learning on Non-IID Data》提出了一种针对跨孤岛联邦学习中non-IID数据场景的个性化协作方法,通过联邦注意力信息传递机制(FedAMP)和启发式扩展(HeurFedAMP)提升模型性能,并在凸和非凸模型上验证了收敛性,实验表明其在用户数据分布差异明显的场景下效果显著。研究背景与问题提出联邦学习在独立同分布(IID)数据下表现良好,但实际应用中用户数据常呈现非独立同分布(non-IID)特征。传统全局协作方法忽略个体数据差异,导致模型性能下降。本文聚焦跨孤岛(cross-silo)场景,提出新算法促进相似数据用户间的协作,解决non-IID数据下的联邦学习挑战。方法创新与核心算法1. FedAMP算法目标函数构建:通过引入注意力机制,将个性化联邦学习问题建模为以下优化目标:其中,前半部分为用户损失函数之和,后半部分为注意力机制项,通过非线性函数 $ A(cdot) $ 度量模型参数差异(如负指数函数 $ A(x)=1-e^{-x/sigma} $)。优化步骤:梯度下降阶段:计算中间参数 $ U^k $,通过注意力机制调整相似用户间的协作强度:临近点法阶段:结合二次正则化优化最终参数 $ W^k $,平衡模型接近性与损失值:参数更新规则:通过注意力权重 $ xi_{i,j} $ 整合相似用户参数,确保距离越近的模型影响越大:其中 $ A'(x) $ 递减特性保证了协作的局部性。2. HeurFedAMP算法针对高维数据计算复杂度高的问题,HeurFedAMP简化注意力优化,直接通过余弦相似度整合用户参数:该方法放弃优化注意力函数,直接基于参数相似性进行协作,降低计算开销。实验设计与结果分析1. 数据集与评估指标数据类型:Pathological non-IID:随机合成两种类型样本的数据。Practical non-IID:用户分组后合成多类型样本,同组用户数据分布相似。评估指标:以通信轮次中的最佳平均测试准确率(BMTA)衡量模型性能。2. 实验结果不同数据类型对比:在Practical non-IID数据下,FedAMP和HeurFedAMP均显著优于传统方法,证明其对相似用户协作的促进作用。测试准确率比例:两种方法在用户数据类别区分明显的场景下表现优异,HeurFedAMP在计算效率上更具优势。结论与启示本文提出的FedAMP和HeurFedAMP算法通过注意力机制或相似性整合,有效提升了跨孤岛联邦学习在non-IID数据下的性能。实验表明,在用户数据分布差异显著的场景中,促进同类用户协作是提升模型泛化能力的关键。未来工作可进一步探索动态注意力调整或轻量化设计,以适应更复杂的实际应用需求。



































