ISBN/价格: | 978-7-121-47740-9:CNY159.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 解构大语言模型/.唐亘著 |
出版发行项: | 北京:,电子工业出版社:,2024.5 |
载体形态项: | xviii, 414页:;+图 (部分彩图):;+24cm |
提要文摘: | 本书从模型的结构和数据基础两个方面解构大语言模型, 以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面, 大语言模型属于深度神经网络, 其设计核心是注意力机制, 因此, 本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面, 本书既涉及模型训练的工程基础, 如反向传播, 又涉及数据的使用方式, 如迁移学习、强化学习, 以及传统的监督学习和无监督学习。此外, 本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感, 以提高模型的稳定性和可解释性。 |
题名主题: | 自然语言处理 |
索书号: | TP391/T33 |
中图分类: | TP391 |
个人名称等同: | 唐亘 著 |
记录来源: | CN 上海新华 20231229 |