
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
最新上架
- 会员
用ChatGPT轻松玩转机器学习与深度学习
本书共14章,主要内容包括探索性数据分析、有监督学习(线性回归、SVM、决策树等)、无监督学习(降维、聚类等),以及深度学习的基础原理和应用等。计算机18万字 - 会员
AI文案高手速成118例:提问生成+修改润色+热门模板+应用案例
全书通过118个实用技巧讲解+118集教学视频演示+160多个素材回复文件+144页PPT教学课件,通过“提问生成+修改润色+热门模板+应用案例”4大专项内容,帮助小白快速成为AI文案高手!本书具体内容包括16种AI提问技巧、13种指令优化技巧、11种高效提问技巧、9种文案修改技巧、7种文案润色方法、11类营销文案指令模板、12类办公文案指令模板、13类自媒体文案指令模板、12类教育学术文案指令模计算机11.6万字 - 会员
巧用ChatGPT轻松学演讲
本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。计算机19.1万字 - 会员
硅基物语·AI大爆炸:ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来
本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字 - 会员
预训练语言模型:方法、实践与应用
近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang计算机12.7万字 - 会员
深度学习与大模型基础
本书从基础的神经网络、卷积神经网络、循环神经网络等入门知识,到深度学习的应用领域如计算机视觉、自然语言处理等高级主题都有涉及,可以帮助读者更好地理解深度学习知识,并为未来的职业发展打下坚实的基础。计算机23.6万字 - 会员
大模型工程化:AI驱动下的数据体系
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、计算机15.6万字 心与芯:我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发计算机13.5万字- 会员
AI时代程序员开发之道:ChatGPT让程序员插上翅膀
本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。计算机8.8万字