ISBN/价格: | 978-7-5766-0941-7:CNY78.00 |
---|---|
作品语种: | chi |
出版国别: | CN 320000 |
题名责任者项: | R自然语言处理导论/.鲍贵, 莫俊华, 陆俊花编著 |
出版发行项: | 南京:,东南大学出版社:,2023.11 |
载体形态项: | 307页:;+图:;+26cm |
提要文摘: | 本书系统介绍R语言在自然语言处理中的应用, 包括十一章内容, 遵循由易到难、循序渐进的原则。第一章是R语言入门, 第二章介绍字符串处理。第三章介绍常见的文本统计方法, 包括统计文本词数、句子数和平均长、绘制词频表以及词频分布图。第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法, 包括传统的类符形符比和平均分段类符形符比等。第五章同第四章一样利用R数据包koRpus。第六章聚焦于n元组和关键词提取方法。第七章介绍两种特殊形式的n元组, 即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量。第九章着重介绍基于整洁文本的自然语言处理技术。第十章介绍中文自然语言处理技术。第十一章是本书的最后一章, 介绍如何对文本词汇开展词类标注和句法成分依存分析, 包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。 |
并列题名: | Introduction to natural language processing with R eng |
题名主题: | 程序语言 自然语言处理 |
非控主题词: | R语言 |
中图分类: | TP312.8R |
个人名称等同: | 鲍贵 编著 |
个人名称等同: | 莫俊华 编著 |
个人名称等同: | 陆俊花 编著 |
记录来源: | CN 人天书店 20231218 |
记录来源: | CN YNAU 20240513 |