当地时间10月30日,美国开放人工智能研究中心(OpenAI)宣布,为了衡量语言模型的真实性,将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。
上一篇:AI分析 | 手筋第576题:黑先围棋手筋题10月31日
下一篇:OpenAI 宣布开源 SimpleQA 新基准,专治大模型“胡言乱语”