悟道·文澜:超大规模多模态预训练模型带来了什么?
摘要:提出了悟道·文澜的brivl双塔模型。该模型利用6.5亿对互联网图文数据,通过自监督的任务来训练,是目前最大的中文通用图文预训练模型。同时,还提出了悟道·文澜的多语言多模态预训练单塔模型—mlmm。实验结果证明,这两个模型在多个国际公开数据集上均取得了最佳性能。设计了实验并讨论超大规模多模态预训练模型对文本编码、图像生成和图文互检带来的影响,以及文澜模型的落地应用与学科交叉成果。
关键词:多模态预训练;多语言预训练;双塔模型;单塔模型
abstract: a multimodal pre-training two-tower model c ……阅读全文