IF9.CN 消息,10 月 31 日,OpenAI 表示,为了评估语言模型的事实性,推出了名为 SIMPLEQA 的新基准,并将其开源。(金十)