天天即时看!最大CLIP!LAION发布CLIP的扩增定律
2022-12-24 08:36:54


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

全球观点:帝科股份(300842)12月29日主力资金净卖出978.72万元

2022-12-30

讯息:涉及就业、医疗、教育……

2022-12-30

合肥《爱乐之城》新年音乐会演出延期的公告

2022-12-29

我国生态环境建设取得巨大成效

2022-12-29

当前视讯!山西省A级景区有哪些

2022-12-29

环球热门:持续引领手机自拍发展 vivo S16系列再创人像自拍新体验

2022-12-29

2023年不同维度下的投资机会_环球速看料

2022-12-29

对离去的人怀念的句子(精选440句)-快报

2022-12-28

首创险企科技投入产出评价体系,众安科技、清华大学联合发布保险科技创新指数2022_全球播资讯

2022-12-28

焦点热文:绿康生化12月28日盘中跌幅达5%

2022-12-28

邮你贷网贷10万逾期会被对方起诉吗|世界热点

2022-12-28

12月27日基金净值:华夏蓝筹混合(LOF)A最新净值1.674,涨0.12%

2022-12-28

振邦智能(003028):董事会、监事会换届选举|热资讯

2022-12-27

独家对话丨编剧衣向东:护卫者是一群美好生活的护航人|天天快资讯

2022-12-27

当前消息!瑞丰农商行:2名监事及45名其他管理人员累计增持股份237.63万股

2022-12-27

宏川智慧: 关于召开2023年第一次临时股东大会的通知 热点评

2022-12-26

奉节县离婚前纠纷律师费用一般怎么计算|每日速讯

2022-12-26

赣锋锂业:投资设立新材料公司,含生态环境材料制造业务_今日讯

2022-12-26

叮当钱包逾期2天多久会上征信? 天天消息

2022-12-25

支持开票 | Python实证指标构建与文本分析 世界热点评

2022-12-25