語言大模型排名

 

LMSYS聊天機器人競技場是一個眾包開放平台,用於大型語言模型(LLM)的評估。我們已收集了超過1,000,000次人工配對比較,使用Bradley-Terry模型對LLM進行排名,並以Elo等級制度顯示模型評分。您可以在我們的論文中找到更多詳細信息。聊天機器人競技場依賴社區參與,請投票貢獻您的一份力量!