品玩6月12日讯,漫多据 huggingface 页面展现 ,学推Meta AI 克日散漫香港大学以及密歇根大学宣告了一款根基数据集,出基测试用来测试狂语言模子的准数因果推理能耐。
这款数据集收录了逾越40万个样本 ,据集并拟订了一个名为 Corr2cause 的狂语新使命 。它经由一组相关语句来判断变量之间的言模因果因果关连。研发团队当初已经经由该数据集评估了17款现有的推理大模子产物 。
经由试验 ,漫多团队评估现有的学推 17 个大型语言模子不一个在这项隧道的因果推理使命上展现精采 。
出基测试