語言大模型排名

LMSYS聊天機器人競技場是一個眾包開放平台，用於大型語言模型（LLM）的評估。我們已收集了超過1,000,000次人工配對比較，使用Bradley-Terry模型對LLM進行排名，並以Elo等級制度顯示模型評分。您可以在我們的論文中找到更多詳細信息。聊天機器人競技場依賴社區參與，請投票貢獻您的一份力量！