名为语义学者的AI:能够把长篇论文提炼成一句话摘要
majer @ 2020.11.26 , 04:42 下午莎士比亚在《哈姆雷特》(Hamlet)里,借剧中剧的角色向剧中国王和王后传达了一句箴言:简洁是智慧的灵魂,冗长是肤浅的藻饰。
西雅图的艾伦人工智能研究所对此深表赞同,于本周推出了一款AI系统,新功能可将冗长的计算机科学报告总结成几句话,以节省文献审稿的时间。
系统名为“语义学者”,是由AI驱动并用于科学研究的研究工具。它最新上线的摘要功能,可分析大量科学研究论文,并将其简化为一句话摘要。预计未来一个月有超700万用户访问语义学者。
目前,语义学者数据库里有1000万篇计算机科学论文。根据监督数据库的Dan Weld的说法,将陆续添加其他学科的论文。
系统为研究人员带来了巨大的便利。早期测试的反响一直十分积极。“大家都很喜欢我们的AI。”
这些年来,已开发出各种自然语言处理程序来总结文档。他们通常使用以下两种方法:着重于选择代表性文本并在摘要中逐字使用。如2018年开发的Paper Digest似乎会提取关键句子,而不是用自己的话来重写。
另一种方法是抽象的。它使用自然语言生成算法来创建具有原始措辞的摘要。近年来,人工智能自然语言生成技术的进步使这种方法成为程序员中的首选。
语义学者是所有总结工具中压缩率最高的系统。科学论文平均5000字,语义学者的摘要约为21字。压缩率为1/238。最接近语义学者的竞品系统才将文档压缩到1/36。
西雅图华盛顿大学的信息科学家Jevin West测试了新功能,他说:“我预计,这种工具将在不久的将来成为学术搜索的标准。实际上,考虑到现实需要,我很惊讶现在才有人做出来这个。”
他指出,目前还不完美,“但这绝对是朝正确方向迈出的一步,”
艾伦研究所的团队开源了其代码。他们还建立了一个向所有人开放的示范站点。scitldr.apps.allenai.org/
目前,仅仅可分析英文撰写的论文。但是作者希望最终能包含其他语言的文档。
https://techxplore.com/news/2020-11-ai-tool-lengthy-papers-sentence.html