Tag: Multilingual Capabilities
All the articles with the tag "Multilingual Capabilities".
-
The Unreasonable Effectiveness of Model Merging for Cross-Lingual Transfer in LLMs
本文通过模块化方法,利用大型语言模型参数在数学推理和多语言能力上的分离性,提出Layer-Swapping等策略,在低资源语言跨语言迁移中显著优于非模块化基线,尤其在数据受限场景下表现最佳。