|
论文 |
|
|
|
|
利用小样本量机器学习实现学术文摘结构的自动识别
论文明细:
白光祖, 何远标,马建霞,刘建华,邹益民.
利用小样本量机器学习实现学术文摘结构的自动识别[J] .
现代图书情报技术,
2014,(7/8) :34-40.
关键词:文摘;结构识别;机器学习
英文关键词:Science abstract;Structure Identifying;Machine Learning
摘要:【目的】通过在小样本量下基于机器学习算法实现文摘语句的自动分类,以此实现学术文摘结构的自动识别。【方法】设计了多种学术文摘的文本表示特征,并利用自然语言处理技术实现了这些特征的自动提取,以此指导朴素贝叶斯、支持向量机模型进行训练,并利用训练模型自动识别文摘结构。【结果】实验证明该方法较之于文献中方法能够在较少训练语料下即可实现相当甚至较好的识别准确率。【局限】由于文摘中“方法”类别语句缺乏固定的类别特征词与核心动词,导致算法对该类别语句识别准确率较低。【结论】研究所提方法是一种小样本量情况下行之有效的学术文摘结构自动识别方法。 .
全文下载
|
|