网站地图 | 联系我们 | English | 中国科学院
本站查询
 
首页 机构概况 机构设置 科研成果 研究队伍 资源&服务 研究生教育 交流合作 学术出版物 创新文化 党群园地
科研成果
概况介绍
获奖
论文
专著
机构知识库
现在位置:首页 > 科研成果 > 论文
论文
 
利用小样本量机器学习实现学术文摘结构的自动识别
论文明细:
白光祖, 何远标,马建霞,刘建华,邹益民. 利用小样本量机器学习实现学术文摘结构的自动识别[J] . 现代图书情报技术, 2014,(7/8) :34-40.
关键词:文摘;结构识别;机器学习
英文关键词:Science abstract;Structure Identifying;Machine Learning
摘要:【目的】通过在小样本量下基于机器学习算法实现文摘语句的自动分类,以此实现学术文摘结构的自动识别。【方法】设计了多种学术文摘的文本表示特征,并利用自然语言处理技术实现了这些特征的自动提取,以此指导朴素贝叶斯、支持向量机模型进行训练,并利用训练模型自动识别文摘结构。【结果】实验证明该方法较之于文献中方法能够在较少训练语料下即可实现相当甚至较好的识别准确率。【局限】由于文摘中“方法”类别语句缺乏固定的类别特征词与核心动词,导致算法对该类别语句识别准确率较低。【结论】研究所提方法是一种小样本量情况下行之有效的学术文摘结构自动识别方法。 .
全文下载
中国科学院兰州文献情报中心 甘肃省科技图书馆 陇ICP备05000311号
地址:甘肃省兰州市天水中路8号  邮编:730030  电话:0931-8273628 Mail:executive-office@llas.ac.cn