Tag: Multimodal Data

All the articles with the tag "Multimodal Data".

Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data

Published: 2 Jun, 2025 at 01:15 PM

86.00 🤔

本文通过大规模实验证明，预训练小型Transformer模型在考虑参数大小的情况下，能在文本、图像和音频的分布外数据上实现与传统压缩算法竞争的压缩比，尤其在训练模态内表现优异，但跨模态迁移能力较弱。
Cross-Lingual Optimization for Language Transfer in Large Language Models

Published: 26 May, 2025 at 11:23 AM

85.77 🤔

本文提出跨语言优化（CLO）方法，通过翻译数据和改进的DPO策略，将英语中心的大型语言模型有效转移到目标语言，在保持英语能力的同时显著提升目标语言性能，尤其在低资源语言中以更少数据取得优于传统SFT的结果。
Achieving Tokenizer Flexibility in Language Models through Heuristic Adaptation and Supertoken Learning

Published: 23 May, 2025 at 11:14 AM

85.73 🤔

本文提出TokenAdapt框架，通过混合启发式初始化策略实现分词器移植，并在零样本困惑度测试中显著优于基线方法，同时初步探索Supertoken学习以提升压缩效率。
IDEAL: Data Equilibrium Adaptation for Multi-Capability Language Model Alignment

Published: 26 May, 2025 at 11:23 AM

85.61 🤔

IDEAL提出了一种基于梯度的迭代数据均衡适应框架，通过动态优化监督微调（SFT）中多领域数据集的比例，在2次迭代内显著提升大型语言模型的多任务性能，平均得分提高约7%。
Task-Core Memory Management and Consolidation for Long-term Continual Learning

Published: 17 May, 2025 at 11:01 AM

85.53 🤔

This paper introduces Long-CL, a human memory-inspired framework for long-term continual learning, leveraging task-core memory management and selective sample consolidation to significantly outperform baselines by 7.4% and 6.5% AP on two novel benchmarks, MMLongCL-Bench and TextLongCL-Bench, while mitigating catastrophic forgetting.

Tag: Multimodal Data

Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data

Cross-Lingual Optimization for Language Transfer in Large Language Models

Achieving Tokenizer Flexibility in Language Models through Heuristic Adaptation and Supertoken Learning

IDEAL: Data Equilibrium Adaptation for Multi-Capability Language Model Alignment

Task-Core Memory Management and Consolidation for Long-term Continual Learning