研究指控LM Arena帮助顶级AI实验室操纵基准测试（音频）

科技汇总

研究指控LM Arena帮助顶级AI实验室操纵基准测试（音频）

一篇新论文由人工智能实验室Cohere、斯坦福大学、麻省理工学院和Ai2联合发布，指控LM Arena——流行的众包AI基准Chatbot Arena背后的组织，帮助一些特定的AI公司在排行榜中获得更好的分数，从而损害了竞争对手。根据作者的说法，LM Arena允许像Meta、OpenAI、Google和Amazon等行业领先的AI公司私下测试多个AI模型变体，并没有发布表现最差的分数。这使得这些公司更容易在平台排行榜上获得高位，但并非所有公司都有这样的机会。Cohere的人工智能研究副总裁兼论文合著者Sara Hooker在接受TechCrunch采访时表示：“只有少数公司被告知可以进行这种私下测试，而一些公司的私下测试数量远远超过其他公司。这是一种游戏化。。

打开APP收听

研究指控LM Arena帮助顶级AI实验室操纵基准测试（音频）

失控坠落：53年后苏联金星探测器Kosm

Google Play 应用数量自202

英特尔推出新显卡驱动程序提升笔记本GP

EA裁员数百人并取消《Titanfal

Firefox推出久违的标签组功能，增强

SK Telecom因重大数据泄露提供S

Reddit对苏黎世大学研究者展开法律行

OpenBSD 7.7版本发布，增强硬件

亚马逊将显示消费者的关税成本报告称（音频

亚马逊成功发射首批Kuiper互联网卫星

Duolingo将用AI取代合同工（音频

Nixplay将数字相框的免费云存储从1

软藤状机器人助力救援人员在灾区寻找幸存者

密尔沃基警察局考虑用250万张照片换取免

比特币疑似盗窃事件导致Monero价格上