如何使用大型语言模型

在最新发布的视频中，知名人工智能专家卡帕西（Andrej Karpathy），深入探讨了他在日常工作中如何高效地使用大型语言模型（LLMs）。他详细介绍了LLMs的基本原理、训练方法以及在实际应用中的最佳实践。通过丰富的案例和实用的技巧，卡帕西展示了如何将LLMs融入到编程、写作和研究等各个领域，以提升工作效率和创造力。这段视频对于希望深入了解并应用LLMs的从业者和研究人员而言，具有重要的参考价值。

卡帕西：我如何使用大型语言模型

Andrej Karpathy分享如何在日常工作中高效利用大型语言模型

在人工智能领域，卡帕西（Andrej Karpathy）以其在深度学习和神经网络方面的卓越贡献而闻名。在他最新发布的视频“How I use LLMs”中，卡帕西分享了他在日常工作中如何高效地利用大型语言模型（LLMs）来提升生产力和创造力。

理解LLMs的基础

卡帕西首先强调，LLMs的核心在于两个关键组件：参数文件和运行代码。以Llama 2-70b模型为例，这个模型包含700亿个参数，存储在一个约140GB的二进制文件中。运行代码则是用于加载这些参数并执行模型推理的程序，可以用C、Python等语言编写。他指出，尽管模型的训练过程复杂且资源密集，但一旦训练完成，部署和使用相对简单。

LLMs的训练过程

训练一个像Llama 2-70b这样的模型，需要处理约10TB的文本数据，这些数据通常来自互联网的大规模抓取。训练过程需要约6000个GPU连续运行12天，耗资约200万美元。卡帕西形象地将这一过程比作对互联网的大规模有损压缩，将庞大的文本数据浓缩为一个包含模型权重的参数文件。

实际应用中的最佳实践

在实际应用方面，卡帕西分享了他如何将LLMs融入日常工作：

编程助手：利用LLMs生成代码片段、调试程序，甚至编写完整的函数或模块，提高开发效率。
写作工具：在撰写技术文档、博客文章时，借助LLMs提供的语言生成能力，快速生成高质量的内容。
研究辅助：通过LLMs快速获取相关领域的信息和资料，加速研究过程。

他还强调，尽管LLMs功能强大，但在使用时应保持审慎，确保生成内容的准确性和可靠性。

未来展望

卡帕西展望了LLMs的发展前景，提出未来的模型将具备更强的多模态处理能力，能够理解和生成不仅限于文本的信息，如图像和音频。此外，他还设想了“LLM OS”的概念，即以LLMs为核心的操作系统框架，提供类似于当前操作系统甚至更强大的功能。

结语

通过这段视频，卡帕西为我们展示了如何在实际工作中高效地利用大型语言模型。他深入浅出的讲解和丰富的实践经验，为从业者和研究人员提供了宝贵的指导。随着LLMs的不断发展和普及，我们有理由相信，它们将在更多领域发挥重要作用，助力人类实现更高的生产力和创造力。

章节摘要

00:00:00 LLM 生态系统的不断发展介绍
00:02:54 ChatGPT 的交互机制解析
00:13:12 基本的 LLM 交互示例
00:18:03 了解所使用的模型及其定价层级
00:22:54 思维模型及其适用场景
00:31:00 工具使用：互联网搜索
00:42:04 工具使用：深入研究
00:50:57 文件上传，将文档添加到上下文中
00:59:00 工具使用：Python 解释器及 LLM 生态系统的复杂性
01:04:35 ChatGPT 高级数据分析：图表与可视化
01:09:00 Claude Artifacts：应用程序、图示
01:14:02 Cursor：Composer 代码写作
01:22:28 音频（语音）输入/输出
01:27:37 高级语音模式（即模型内部的真实语音处理）
01:37:09 NotebookLM 及播客生成
01:40:20 图像输入，OCR（光学字符识别）
01:47:02 图像输出：DALL·E、Ideogram 等
01:49:14 视频输入：应用中的“指点交谈”功能
01:52:23 视频输出：Sora、Veo 2 等
01:53:29 ChatGPT 记忆功能及自定义指令
01:58:38 自定义 GPTs
02:06:30 总结

原文标题：How I use LLMs
链接：https://www.youtube.com/watch?v=EWvNQjAaOHw
网盘：英才资源 > 专题研修 > ai > Andrej Karpathy – How I use LLMs_EWvNQjAaOHw.mp4
说明：网盘中包含中英文字幕srt文件、章节书签m3u8（推荐用VLC播放）

讲座注释及相关链接

How I use LLMs

Chapters

00:00:00 Intro into the growing LLM ecosystem
00:02:54 ChatGPT interaction under the hood
00:13:12 Basic LLM interactions examples
00:18:03 Be aware of the model you’re using, pricing tiers
00:22:54 Thinking models and when to use them
00:31:00 Tool use: internet search
00:42:04 Tool use: deep research
00:50:57 File uploads, adding documents to context
00:59:00 Tool use: python interpreter, messiness of the ecosystem
01:04:35 ChatGPT Advanced Data Analysis, figures, plots
01:09:00 Claude Artifacts, apps, diagrams
01:14:02 Cursor: Composer, writing code
01:22:28 Audio (Speech) Input/Output
01:27:37 Advanced Voice Mode aka true audio inside the model
01:37:09 NotebookLM, podcast generation
01:40:20 Image input, OCR
01:47:02 Image output, DALL-E, Ideogram, etc.
01:49:14 Video input, point and talk on app
01:52:23 Video output, Sora, Veo 2, etc etc.
01:53:29 ChatGPT memory, custom instructions
01:58:38 Custom GPTs
02:06:30 Summary

卡帕西：我如何使用大型语言模型

Andrej Karpathy分享如何在日常工作中高效利用大型语言模型

章节摘要

讲座注释及相关链接

Chapters

Links