基于Nutch的Web数学公式提取

崔林卫, 苏伟, 郭卫, 李廉

广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (01) : 167 -172.

PDF
广西师范大学学报(自然科学版) ›› 2011, Vol. 29 ›› Issue (01) : 167 -172. DOI: 10.16088/j.issn.1001-6600.2011.01.027

基于Nutch的Web数学公式提取

    崔林卫, 苏伟, 郭卫, 李廉
作者信息 +

Author information +
文章历史 +
PDF

摘要

本文主要研究基于公式的数学搜索引擎中数学公式的识别和提取方法,总结了MathML、Open-Math、LaTex、Infix格式数学公式在网页中出现时的各自特征,提出了基于特征和启发式规则的公式识别和提取方法,并用实验说明了该识别和提取方法的可行性和准确率。

关键词

搜索引擎 / 爬虫 / 公式搜索 / 数学公式 / MathML / OpenMath

Key words

引用本文

引用格式 ▾
基于Nutch的Web数学公式提取[J]. 广西师范大学学报(自然科学版), 2011, 29(01): 167-172 DOI:10.16088/j.issn.1001-6600.2011.01.027

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

83

访问

0

被引

详细

导航
相关文章

AI思维导图

/