
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
同类热门书
最新上架
- 会员本书通过对10款人工智能应用的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作,AI爆款文案写作工具,人工智能辅助泛流量文案、泛商业文案、私域文案创作,利用人工智能实现文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等。计算机12.2万字
- 会员(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字
- 会员作为一本技术性很强的书,《中国人形机器人创新发展报告2025》覆盖人工智能、大模型、视觉捕捉、自动化控制等一些列技术和学科。本书系统性梳理了《人形机器人创新发展指导意见》发布以来中国人形机器人产业在关键技术、产品培育、场景应用、生态营造、支撑能力以及保障措施等多方面的发展态势,通过多角度案例研究,全面解析了中国在这一领域的成果与经验,力图展示中国人形机器人产业的全貌,洞察人形机器人产业未来发展的新计算机9万字
- 会员本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字
- 会员本书全面、系统地探讨科学计算的背景、机器学习的重要性以及昇思MindSpore框架在科学计算中的广泛应用。科学计算作为一门交叉学科,融合了数学、计算机科学与技术等领域的专业知识,在现代科学研究和工程实践中起着关键作用。本书以MindSpore为平台,深入研究这一全场景AI框架在科学计算中的探索与实践,通过对基础理论、行业应用和实际案例的详细介绍,为读者提供全方位的学习和参考资料。全书共8章,首先详计算机15.7万字
- 会员本书介绍提示工程的基本概念和实践,旨在帮助读者了解如何构建高质量的提示内容。内容包括:认识大语言模型、ChatGPT应用体验、ChatGPTAPI、PythonChatGPTAPI库、提示工程、提示类型、基于提示工程应用Python数据分析等。计算机14万字