洞察 Insights

SciArena：AI赋能科学发现的新里程碑，解锁大模型科研潜力的“试金石”

全球首个科研LLM竞技场SciArena的上线，标志着大模型在科学文献任务中的真实能力评估进入新阶段，OpenAI o3暂居榜首。该平台以专家众包、双盲对决机制揭示了AI理解人类科研偏好的局限性，预示着未来AI与科学发现将走向更深层的人机协同与垂直专业化。