当前位置：首页-软文-正文

chatgpt 4 训练数据量 Chatgpt论文笔记——MiNiGPT4解读

文章浏览阅读1.4k次。MiniGPT-4是通过结合视觉编码器Blip-2和文本编码器Vicuna，附加投影层构建的模型。预训练阶段使用500万图文对，固定编码器参数。

前言

代码地址：

摘要

摘要写的就很简单了，标黄的是重点，可以看到这个方法很简单，就是拿了一个视觉的（Blip-2）以及拿了一个文本的（），最后外加上一个层就构成了，并且在训练的时候视觉和文本的都是冻结参数的，所以相当于只是拿视觉和文本的编码器来用，训练只训外加的层。

方法

方法就是说了视觉编码器用的Blip-2，他是由vit+q-构成的。文本用的是，基于LLaMA设计的。就当作文本和图像的就好了，具体细节可以不看，基本就是的结构。

然后就介绍了训练的细节，训练分了两个阶段，第一阶段预训练用的是500w的图文对训模型，并且视觉和文本的都是冻结参数的，第二阶段用精修的数据集3500条图文对精调模型参数。

第一阶段预训练

没啥可说的，介绍了下训练的参数，用了4张A100训500w图文对的数据，训了10个小时。第一阶段训练完作者测试模型发现模型生成的文本有很多重复的，不完整的，没有逻辑的句子，对人类来说阅读是十分不友好的，所以有了第二阶段的精调。

第二阶段训练数据构建

第二阶段的主要目的是用高质量的图文对数据来消除视觉和语言的领域差异，通俗点说就是让模型说的话更加的人类可读。

构建精修数据集的具体做法如下：

三：这样生成的描述还是存在噪声以及错误的回答（重复的回答，不连贯的回答），接下来用来修正这些回答：四：人工验证图像描述的正确性并且有些无法检测的冗余句子也人工修正。最后从5000里面精挑了3500条。

就比较简单了，拿3500条精修的数据直接就好了，输入的模版是###Human: ###:

训练的机器是一张A100，batch ，跑了400个step。

最后

安装记录：安装记录

软文营销的特点如何通过软文营销引爆你的品牌?软文中巧妙地融入产品而不显得突兀方法
如何通过软文营销引爆你的品牌?软文中巧妙地融入产品而不显得突兀方法?通过软文营销引爆品牌,关键在于创造一个有吸引力的内容,使消费者在阅读过程中自…
专业出黑 软文3个月前004.15M0
产品上市如何推广推广新产品的方法有哪些？
推出新产品怎么推广宣传？新产品营销推广方法有哪些？有一部分商家会通过新产品营销方案来宣传新品上市，如何推广新产品的方法？接下来小编就跟大家分享新…
专业出黑 软文1年前0013.04M0
产品信息流广告浅析信息流广告设计
信息流广告的设计，并不是单纯将广告形式变成和产品信息流中内容一致就可以的。信息流，狭义上来说在我们日常使用的APP中，信息按照类似格式上下排列…
专业出黑 软文5个月前006.28M0
零投资网赚零投资网上赚钱有什么方法？零投资网上赚钱方法分享
零投资网上赚钱有什么方法？零投资网上赚钱方法分享…
专业出黑 软文4个月前006.28M0
家居品牌推广方案家具实体店引流推广方案：打造家居购物新体验
本文将为家具实体店提供一套有效的引流推广方案，帮助其在竞争激烈的市场中脱颖而出。忠诚计划：根据会员消费情况，提供相应的积分、折扣等奖励，提高顾客…
专业出黑 软文2个月前004.54M0
ai图形如何转曲 CDR如何查找未转曲的文字将其转曲
对于做图文印刷行业来说，CDR文件需要对文字进行转曲才不会缺少文字或与文稿核对不上。不是所有的文字字体对方公司也安装有，所以文字转曲是最保险的(…
专业出黑 软文4个月前007.63M0
怎样做好一个项目的推广夸克网盘推广赚钱怎么做？推荐一个一手接单平台
很多用户在推广的过程中都会接触到夸克网盘中文口令，其实就是夸克推广的一种新型结算方式，因为大家都知道短视频自媒体渠道要比一般渠道更加适合操作该项…
专业出黑 软文8个月前009.56M0
文章发表多少钱发表文章与论文重复率发表论文的重复率是多少
论文查重入口可以帮助学者和作者检查文献的原创性。本篇属于和文章重复率检测相关的技巧,为你的文章检测抄袭疑难问题进行解惑。…
专业出黑 软文1年前0011.69M0
工程类职称论文发表，都有哪些热门问题？
这里建议关注一下当地职称评审的相关文件，看看有没有什么特殊要求，还需要注意下发表时间，有些专业性强的期刊发表时间是比较长的，所以应提前几个月准备…
专业出黑 软文6个月前006.28M0
公司产品如何推广如何把一款好的产品进行快速、有效地推广？
如何把一款好的产品进行快速、有效地推广？如何把一款好的产品进行快速、有效地推广？深圳市三人行管理咨询有限公司首席咨询李老师认为，对于一个市场上没…
专业出黑 软文1个月前002.61M0
chatgpt如何登录使用 chatgpt怎么用？国内登录方法介绍
chatgpt是一款人工智能交流软件，在这款软件中我们可以和人工智能进行交流，让我们能够感受到真人一般的人工智能，很多用户都非常的关心chatg…
专业出黑 软文4个月前007.53M0
我想发帖怎么发两名男大学生在寝室公开恋情，室友发帖子吐槽
大学里面有一个“奇葩”的地方，那就是学校“表白墙”，起初大学生在这里期待校园爱情，随着越来越多大学生加入进来，表白墙的功能变得更多，会有大学生分…
专业出黑 软文1年前0012.75M0

{{userData.name}}

chatgpt 4 训练数据量 Chatgpt论文笔记——MiNiGPT4解读

软文营销的特点如何通过软文营销引爆你的品牌?软文中巧妙地融入产品而不显得突兀方法

产品上市如何推广推广新产品的方法有哪些？

产品信息流广告浅析信息流广告设计

零投资网赚零投资网上赚钱有什么方法？零投资网上赚钱方法分享

家居品牌推广方案家具实体店引流推广方案：打造家居购物新体验

ai图形如何转曲 CDR如何查找未转曲的文字将其转曲

怎样做好一个项目的推广夸克网盘推广赚钱怎么做？推荐一个一手接单平台

文章发表多少钱发表文章与论文重复率发表论文的重复率是多少

工程类职称论文发表，都有哪些热门问题？

公司产品如何推广如何把一款好的产品进行快速、有效地推广？

chatgpt如何登录使用 chatgpt怎么用？国内登录方法介绍

我想发帖怎么发两名男大学生在寝室公开恋情，室友发帖子吐槽

产品推广说明高效软文推广：让品牌深入人心

网站抽查审核不给提现处理方法银行提现处理中什么意思

海棠书屋无弹窗免费网络小说阅读下载海棠书屋免费软件功能

平台风控审核实战 | 打造民营银行风控平台，赋能金融业务智慧发展

互联网创业圈被承包了 BAT的圈地运动

怎样勃起如何让阴茎快速勃起呢

显示提款成功买提款码有提现成功的吗，提款码是什么意思

自由发帖的网站可以发帖的网站有哪些？论坛发帖_发帖网站大全

怎样勃起很危险！这几种不良的自慰方式，是时候科普一下

自由发帖的网站台湾十大网站排行中国台湾最常用的网站台湾门户网站有哪些

十大投资健康加盟项目养生馆加盟哪家好？十大排行榜分享！

加盟什么生意赚钱 40个偏门日挣五百元的小本生意成功项目案例

十大投资健康加盟项目泉州加盟什么项目

加盟互联网经销商“互联网+”的8大模式最全案例解析

摆地摊真的能起家吗孔德鲁：从摆地摊起家到创立公司，他拄着双拐闯济南

网上系统审核不给提款【莒南公安保平安创满意】年底了，这份安全防范手册，请收好！

网上赢钱不给提款网上赢钱了提不出钱怎么办

加盟互联网五本主角是恶魔的小说，异界深渊，出卖灵魂，欢乐逗比

加盟什么生意赚钱加盟能赚更多钱还是坑？深度解析创业该加盟还是单干？

{{userData.name}}

相关文章

软文营销的特点 如何通过软文营销引爆你的品牌?软文中巧妙地融入产品而不显得突兀方法

产品上市如何推广 推广新产品的方法有哪些？

产品信息流广告 浅析信息流广告设计

零投资网赚 零投资网上赚钱有什么方法？零投资网上赚钱方法分享

家居品牌推广方案 家具实体店引流推广方案：打造家居购物新体验

ai图形如何转曲 CDR如何查找未转曲的文字将其转曲

怎样做好一个项目的推广 夸克网盘推广赚钱怎么做？推荐一个一手接单平台

文章发表多少钱 发表文章与论文重复率 发表论文的重复率是多少

工程类职称论文发表，都有哪些热门问题？

公司产品如何推广 如何把一款好的产品进行快速、有效地推广？

chatgpt如何登录使用 chatgpt怎么用？国内登录方法介绍

我想发帖怎么发 两名男大学生在寝室公开恋情，室友发帖子吐槽

产品推广说明 高效软文推广：让品牌深入人心

网站抽查审核不给提现处理方法 银行提现处理中什么意思

海棠书屋无弹窗免费网络小说阅读下载 海棠书屋免费软件功能

平台风控审核 实战 | 打造民营银行风控平台，赋能金融业务智慧发展

互联网创业圈被承包了 BAT的圈地运动

怎样勃起 如何让阴茎快速勃起呢

显示提款成功 买提款码有提现成功的吗，提款码是什么意思

自由发帖的网站 可以发帖的网站有哪些？论坛发帖_发帖网站大全

怎样勃起 很危险！这几种不良的自慰方式，是时候科普一下

自由发帖的网站 台湾十大网站排行 中国台湾最常用的网站 台湾门户网站有哪些

十大投资健康加盟项目 养生馆加盟哪家好？ 十大排行榜分享！