ISBN/价格: | 978-7-121-47740-9:CNY159.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 解构大语言模型/.唐亘著 |
出版发行项: | 北京:,电子工业出版社:,2024.05 |
载体形态项: | XVIII, 414页:;+彩图:;+24cm |
提要文摘: | 本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。 |
题名主题: | 自然语言处理 |
中图分类: | TP391 |
个人名称等同: | 唐亘 著 |
记录来源: | CN YNAU 20241101 |