Chatbot Arena 也被成为聊天机器人竞技场,它是由LMSYS Org 创建的一个 大语言模型(LLM、对比竞技平台,通过对比后并将这个大语言模型(LLM、进行排名。最新一期大语言模型(LLM、排行榜出炉,GPT4 依旧是独领风骚,排在第二位的是 Claude-v1 模型,GPT 3.5 turbo 排名第四。
目前该平台通过三种评分机制,来对比哪个聊天机器人实力最强。这三个机制分别是Arena Elo rating 、MT-bench 、MMLU 其中第一个Arena Elo rating 评分系统类似于王者荣耀中的elo匹配机制,它把各家的聊天机器人当做玩家,让他们之间随机对战,通过4万多名用户投票来进行elo评级。
- Chatbot Arena – 一个众包、随机的战斗平台。我们使用 40K+ 用户投票来计算 Elo 评级。
- MT-Bench – 一组具有挑战性的多回合问题。我们使用 GPT-4 对模型响应进行评分。
- MMLU(5-shot、——衡量模型在 57 项任务上的多任务准确性的测试。
收录说明:
1、本网页并非 Chatbot Arena 官网网址页面,此页面内容编录于互联网,只作展示之用;2、如果有与 Chatbot Arena 相关业务事宜,请访问其网站并获取联系方式;3、本站与 Chatbot Arena 无任何关系,对于 Chatbot Arena 网站中的信息,请用户谨慎辨识其真伪。4、本站收录 Chatbot Arena 时,此站内容访问正常,如遇跳转非法网站,有可能此网站被非法入侵或者已更换新网址,导致旧网址被非法使用,5、如果你是网站站长或者负责人,不想被收录请邮件删除:i-hu#Foxmail.com (#换@)
前往AI网址导航
2、本站所有文章、图片、资源等如果未标明原创,均为收集自互联网公开资源;分享的图片、资源、视频等,出镜模特均为成年女性正常写真内容,版权归原作者所有,仅作为个人学习、研究以及欣赏!如有涉及下载请24小时内删除;
3、如果您发现本站上有侵犯您的权益的作品,请与我们取得联系,我们会及时修改、删除并致以最深的歉意。邮箱: i-hu#(#换@)foxmail.com