首页
洞察
早报
日报
主题探索
关于
大模型评估
洞察 Insights
SciArena:AI赋能科学发现的新里程碑,解锁大模型科研潜力的“试金石”
全球首个科研LLM竞技场SciArena的上线,标志着大模型在科学文献任务中的真实能力评估进入新阶段,OpenAI o3暂居榜首。该平台以专家众包、双盲对决机制揭示了AI理解人类科研偏好的局限性,预示着未来AI与科学发现将走向更深层的人机协同与垂直专业化。
阅读全文