苹果推出换代AI大模型MM1.5 拥有自然语言推理

2024-10-13 11:16:52 来源:互联网
0

AI大潮下,科技巨头苹果公司日前推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。

该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在Hugging Face上发布。

苹果推出换代AI大模型MM1.5 拥有自然语言推理

MM1.5提供了从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。

在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。

参考论文可知,团队在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的图像的理解水平。

此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型(如10亿、30亿参数版本)也能有出色的发挥,实现了更高的效率。

苹果推出换代AI大模型MM1.5 拥有自然语言推理

值得一提的是,苹果公司这次还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。

其中,MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,能够处理各种视觉引用与定位任务,还能总结屏幕上的功能,或者通过与用户的对话进行交互。

尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。

相关内容
标签:苹果
手游推荐
丸漫
小说漫画
全新沉浸式互动阅读APP
斗罗大陆
动漫动作
《斗罗大陆》正版授权,动画声优原班人马加盟,高人气主题曲《破茧》植入,魂兽猎杀真3D斗罗手游《斗罗大陆-斗神再临》激燃来袭!
勇闯女儿国
策略休闲
《勇闯女儿国》是一款Q版回合制游戏,精美2D Q版人物设计,搭配传统故事剧情,酷炫宠物共同潇洒三界,更有神兽、仙侣玩法培养助战,独有万千道具自由回收,多样经典回合玩法无穷乐趣!
皇者-0.1折GM刷充版
经典传奇,皇者回归
经典传奇,皇者回归!本游戏承诺所有充值均为0.1折!游戏独创第四职业魔神,上线送万元充值卡登陆就送,更有每日登录领取真充卡,零元党也可以玩的很开心!游戏不但还原了经典的传奇特色,更加入了一些创新元素!让您和您的那些兄弟驰骋沙城,称霸全服!
分享到:
收藏
违法和不良信息举报
玩家评论
参与人 0,评论数 0

热门评论

全部评论

还没有评论,快来抢沙发~