朋友書店

輸入

汉语词自动生成研究

汉语词自动生成研究

輸入

汉语词自动生成研究

著者
汪梦翔
出版社
学苑出版社
出版年月日
2023.12
価格
¥6,314
ページ数
255
ISBN番号
9787507768121
説明
汉语是一种意合语言,其词义绝大多数来源于内部语素义的组配,而大数据背景下,基于海量数据的语义信息提取能够为语素义的描写和刻画提供充分知识。本书将大数据相关资源和汉语词的语素义提取和描述方法结合,详细描述汉语词的内部组配机制和生成规则,最终更好的实现汉语词的自动生成。汉语词的生成一个重新解构的语素义集合在一定的组配机制作用下进行内部成分再替换的过程。这一过程涉及语义提取、语义解构、语素替换和组配规则生成四个过程。其中高质量的语义提取是前提,多维度的解构是所有工作的基础。作者通过海量数据的挖掘和筛选针对性构建语素义知识库的形式,为汉语词的语义分析提供支撑,然后根据语素的组配关系,确定词项生成的语义来源。语素替换是语义生成的核心,包括语义近似度计算和义项选择两个环节。项目通过构词结构、语素义、物性角色等语义知识,以“语素概念”为基础,计算汉语语素义相似度,然后根据语素义项编码,从而判断可以生成替换的语素及对应的义项。组配规则是决定汉语新词能否正确生成的重要因素,项目通过构建语素组配规则库的形式,生成汉语词的组配机制,使替换对象得以正确组合。 整个流程语素义的挖掘和描述出发,通过基于神经网络模型的词向量生成工具寻找语素概念的近义词网,最终达到由语义到文本的自动生成,可以说是典型的利用大数据及人工智能技术来处理语言的问题。这一技术对自动文摘、机器写作和机器翻译有着重要影响。