王东波,男,1981年生于山东省菏泽市,2012年6月获南京大学信息管理学院情报学博士学位,现为南京农业大学信息科学技术学院讲师。近年来在国内外期刊与会议上发表学术论文35篇。研究领域主要包括自然语言处理、文本挖掘和信息计量。主持或参与南京大学研究生创新基金项目、863项目、自然科学基金项目、社会科学基金项目、教育部和其他项目八项。
发表于2024-11-24
面向非结构化文本的知识发现 2024 pdf epub mobi 电子书
图书标签: 语言学 情报学 句法学 工具书 NLP
本书从句法这一层面入手,基于面向网络获取的英汉双语平行语料这一非结构化数据,结合自然语言处理和文本挖掘的相应技术,在情报学、语言学方法和知识的基础上,针对词汇、简单短语、复杂短语这三个句法层级上的知识挖掘和抽取问题进行了探究,揭示了词汇句法组合的呈现规律,构建了简单短语结构抽取的模型,挖掘了面向复杂短语的类别知识。
面向非结构化文本的知识发现 2024 pdf epub mobi 电子书