Ai工具信息聚合网站
最新公告
网站信息
简介描述

MMBench是一个多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员推出。该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。

MMBench的特点和优势
基于感知与推理,将评估维度逐级细分。约 3000 道单项选择题,覆盖目标检测、文字识别、动作识别、图像
理解、关系推理等 20 个细粒度评估维度
更具鲁棒性的评估方式。相同单选问题循环选项提问,模型输出全部指向同一答案认定为通过,相比传统1次性通过评估 top-1 准确率平均下降 10% ~ 20%。最大程度减少各种噪声因素对评测结果的影响,保证了结果的可复现性。
更可靠的模型输出提取方法。基于 ChatGPT 匹配模型输出与选项,即使模型未按照指令输出也可准确匹配至最合理选项

网站数据

网站标签

Ai模型

网站评估

MMBench被关注loading次,如你需要查询该站的相关权重信息,可以点击下方数据查询进入;如果想查询该网站目前数据,建议以爱站数据为准,更多网站价值评估因素如:MMBench的访问速度、搜索引擎收录以及索引量、用户体验等;要评估一个站的价值,最主要还是需要根据您自身的需求,一些确切的数据则需要找MMBench的站长进行洽谈提供。如网站IP、PV、跳出率等!

网站查询

收录百度收录 - 搜狗收录 - 360 - 必应收录 - 谷歌收录

搜索百度搜索 - 搜狗搜索 - 360搜索 - 必应搜索 - 谷歌搜索

常用查询Whois查询 站长权重 爱站权重 Alexa排名 友链检测 网站安全检测 网站备案查询

特别提示

本网页页面内容是由在2023年12月21日[最后更新于2023年12月21日]收集并发布于Ai模型分类下并只作展示之用,AI工具不保证该外部链接的准确性和完整性,同时该外部链接的指向不由AI工具控制;如果有与MMBench相关业务事宜,请访问其网站获取联系方式;AI工具MMBench无任何关系,对于MMBench网站中信息,请用户谨慎辨识真伪。

相关推荐
工具集
工具集🐔
暂无描述
商量语言大模型
商汤科技推出的类ChatGPT的人工智能大语言模型
LLaMA
Meta(Facebook)推出的AI大语言模型
Gradio
开源的搭建机器学习模型UI界面的Python库
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
HELM
斯坦福大学推出的大模型评测体系
CMMLU
一个综合性的大模型中文评估基准
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
Scale AI
AI机器学习标注训练平台
Lobe
简单免费的机器学习模型训练工具
Watsonx.ai
IBM推出的企业级生成式人工智能和机器学习平台
Segment Anything(SAM)
Meta最新推出的AI图像分割模型
OpenBMB
清华团队支持发起的大规模预训练语言模型库与相关工具
天工AI助手
昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型
Gen-2
Runway最新推出的AI视频生成模型
StableLM
Stability AI推出的开源的类ChatGPT大语言模型
DALL·E2
OpenAI旗下DALL·E 2图像生成模型
DeepFloyd IF
StabilityAI旗下的DeepFloyd团队推出的图片生成模型
MiracleVision奇想智能
美图推出的AI视觉大模型,支持AI图像、设计和视频创作
Ollama
本地运行Llama和其他大语言模型
Coze
字节推出的AI机器人和智能体创建平台
悟道
智源“悟道”大模型,中国首个+世界最大人工智能大模型
AgentGPT
在浏览器中组装、配置和部署自主人工智能的开源项目
盘古大模型
华为旗下多领域大模型
无法访问
热门评论

问:给大家推荐一个非常好的工具查找网站!!!

答:点击下面的链接就可以访问了 ☞点我试试

问:MMBench官网域名是哪个?

答:MMBench官方域名是mmbench.opencompass.org.cn,如果访问不了,建议使用加速器访问

问:MMBench最新官网地址是哪个?

答:MMBench最新可以访问的地址是https://mmbench.opencompass.org.cn/leaderboard,我这边都可以访问的,如果你访问不了那就是和谐了

问:谁能发一个MMBench的永久地址或者发布页啊?

答:MMBench的永久地址可以访问这个https://mmbench.opencompass.org.cn/leaderboard,MMBench发布页我推荐大家用这个MMBench发布页最新更新页面!!!

留言评论
暂无人评论

添加新评论

注册 登录

最新文章
最新评论
  • adwx: 如何联系站长
  • A.I.: 该网站打开后出现错误提示
  • AI助手: 这个目前没有推荐,网上挺多的,你自己找一下
  • 剪辑: 站长有加速器推荐吗?
  • 剪辑: 好的,谢谢站长的回复
  • AI助手: 是的,做这个站的是大佬,虽然界面看上去简陋,但是功能挺不错的
  • AI助手: 已在邮件回复报价及联系等相关信息
  • AI助手: 我这边可以访问,可以尝试更换浏览器或者设备试试,如果依然访问不了...
  • 百度: 不错的网站?
  • 商务合作: 给贵站发了邮件了,看到可以回复一下,想在贵站推广一款我们自己的开...
随机文章
友情链接:工具集 Ai工具 爱玩机网 sitemap