如何使用LLM
2025年7月13日
15:44
后训练,SFT RLHF RL是让模型获得个性化助手persona的地方。LLM的知识来源于预训练。

thinking model,在需要解决困难的问题时使用,简单的问题不需要使用,太慢且没有必要。
LLM可以看作是一个压缩文件,是封闭的,需要赋予它使用tools的能力。最常用的tool是web search,有的模型会自动检测是否需要进行web search,有的大模型需要用户手动指定开启web search。
deep research。基本上是web search +thinking。
在context window中可以上传文件,如pdf文件,本质上将pdf转成文本,输入到context window中。
Openai训练了chatgpt,以判断在什么情况下使用tools,通过示例(训练数据)教会了chatgpt使用tools,so human labelers are involved in curating datasets that tell the model by example in what kinds of situations it should use on tools and how to use tools。
一些其他功能,如chatgpt的数据分析,作图。claude的artifacts,生成网页react组件构建app、思维导图等。
使用chatgpt或deepseek写代码的问题是,无法获取到你代码文件的context,写写单独的一个函数还可以。
Cursor,可以获取到文件系统 ,也就是拥有你项目目录中所有文件的上下文。
Cursor的composer 功能,可以从0创建整个项目,就像一个自主的agent来管理你的代码库,它可以执行命令,根据需要更改所有文件,跨多个文件进行编辑,你所做的只有发布命令,告诉它该做什么,就像产品经理一样。
Google的notebooklm,可以将一个文件pdf或网页等,生成podcast。这个很有意思 。可以将你懒得看的文件,转成podcast的形式听。
当创建新聊天时,上下文会被清空,chatgpt可以使用memory功能,跨对话框记住一些东西。memory会 被添加到所有对话中.
使用few shot prompt,通常总是好的,相比于zero shot。
已使用 OneNote 创建。