• 微头条

    让本地生活更美好

打开APP
科技汇总
研究指控LM Arena帮助顶级AI实验室操纵基准测试(音频)

一篇新论文由人工智能实验室Cohere、斯坦福大学、麻省理工学院和Ai2联合发布,指控LM Arena——流行的众包AI基准Chatbot Arena背后的组织,帮助一些特定的AI公司在排行榜中获得更好的分数,从而损害了竞争对手。根据作者的说法,LM Arena允许像Meta、OpenAI、Google和Amazon等行业领先的AI公司私下测试多个AI模型变体,并没有发布表现最差的分数。 这使得这些公司更容易在平台排行榜上获得高位,但并非所有公司都有这样的机会。Cohere的人工智能研究副总裁兼论文合著者Sara Hooker在接受TechCrunch采访时表示:“只有少数公司被告知可以进行这种私下测试,而一些公司的私下测试数量远远超过其他公司。 这是一种游戏化。 。

打开APP收听

更多推荐
+6
Like
Share
Follow
+