岳阳泡沫板专用胶厂 助力降低AI引文幻觉提升准确率 新款开源语言模型与人类相仿
助力降低AI引文幻觉提升准确率 新款开源语言模型与人类相仿岳阳泡沫板专用胶厂
奥力斯 万能胶生产厂家 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区岳阳泡沫板专用胶厂
中新网北京2月5日电 (记者 孙自法)知名学术期刊《自然》新发表篇计机科学论文称岳阳泡沫板专用胶厂,研究人员开发出个开源语言模型OpenScholar,其在进行准确文献综述面可越商用大语言模型(LLM)。在本项研究开展的实验中,GPT4o会在78-90的情况下出现引文幻觉,而OpenScholar的引文准确率却与人类相仿。
论文作者指出,虽然OpenScholar后续仍需进步优化岳阳泡沫板专用胶厂,但该AI工具有望帮助科学处理复杂且日益繁重的科学文献综述任务。
本项研究相关示意图(图片来自论文)。施普林格·自然 供图据介绍,科学文献综述对于支持循证决策、微调科学过程和引新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。大语言模型可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。
为了生成准确、、透明的科学文献综述,美国华盛顿大学Akari Asai、Hannaneh Hajishirzi和同事及作者起,pvc管道管件胶研发出了开源语言模型OpenScholar。该模型是为科研任务设计的检索增强语言模型,其他系统也用过这个框架,但论文作者将其与个包含4500万篇新开放获取科研论文的业数据库以及个自我评估机制相结,从而优化其输出。
论文作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(个文献综述工具)这类现有系统分别出6.1和5.5。此外,OpenScholar生成的答案在50到70的情况下比注释器的答案有用。
这些研究结果和引文幻觉大幅下降,证明了OpenScholar有望支持和动进步研究工作。论文作者也提醒说,该AI系统仍有局限岳阳泡沫板专用胶厂,同时,基于语言模型的系统法使科学文献综述自动化。因此,他们向学界同时开放ScholarQABench和OpenScholar,以鼓励进步研究和优化。(完)
