AI Engineer
AI engineer vocabulary practice,从会读推进到会写
AI engineer vocabulary practice 的重点,不是再背一遍概念名词,而是把 prompt、retrieval、embedding、inference、evaluation 这些词练成一条能写出来、能解释出来的英文工作流。
先回答搜索问题:AI vocabulary practice 为什么要按工作流练
因为 AI 词汇很少单独出现。你真正需要写的是一条链路:query 如何进入 retrieval,embedding 如何表示内容,reranker 如何排序,context 如何进入 prompt,模型如何 inference,最后怎么 evaluation。
如果这些词只能被单独认出来,你写方案时还是会断;如果这些词能顺着工作流被调用出来,它们才会变成可用的工程表达。
AI Engineer 词汇要按工作流练
AI 词汇最怕混成一锅:prompt、retrieval、embedding、evaluation 都认识,但真正解释一个方案时无法稳定写出来。
更有效的方式是按工作流分组训练:输入如何构造、信息如何检索、模型如何推理、效果如何评估、系统如何上线。
AI 词汇不是名词表,而是解释链
一个 AI Engineer 真正需要的不是记住零散术语,而是能把系统链路讲清楚:用户 query 如何变成 embedding,retriever 如何取回 chunks,reranker 如何重排候选内容,context 如何进入 prompt,模型如何完成 inference,最后如何 evaluation。
如果这些词只能单独背,写方案时仍会断裂;如果这些词能串成解释链,它们才会变成可用的工作语言。
- Query -> embedding:用户输入先被转成向量表示。
- Embedding -> retrieval:系统用向量相似度找回候选内容。
- Retrieval -> rerank:候选片段需要按相关性重新排序。
- Context -> inference:被选中的上下文进入 prompt,模型生成回答。
- Inference -> evaluation:输出结果再用指标、样例和人工标准评估。
Prompt 与上下文
- instruction:给模型的任务说明,练习时注意 stru 这一段。
- constraint:约束条件,常和 requirement 混用,但拼写重点是 strain。
- context:上下文,不要写成 content。
- few-shot:少样本示例,写 prompt 时常用连字符表达。
RAG 与检索
- retrieval:检索,注意 ie 位置;常见错拼是 retrival。
- embedding:向量表示,双 b 双 d 都要稳定。
- chunk:切片,比 segment 更口语化也更工程化。
- rerank:重排,读写时和 ranking 绑定理解。
把 RAG 词串成一条解释链
RAG 词汇最适合用链路方式训练,因为这些词本来就不是孤立出现的。一个完整解释通常会从 query 开始,经过 retrieval,拿到 chunks,生成 embeddings,必要时 rerank,最后把 context 交给模型生成答案。
如果你能把这条链路用英文写出来,说明这些词已经不只是“认识”,而是进入了工作表达。
- A user query is converted into an embedding before retrieval.
- The retriever returns relevant chunks from the knowledge base.
- A reranker improves the order of candidate passages.
- The final prompt includes retrieved context and a clear instruction.
推理、评估与上线
- inference:推理,重点练 infer + ence。
- evaluation:评估,和 benchmark、metric、baseline 一起练。
- hallucination:幻觉,长词分段 hal-lu-ci-na-tion。
- deployment:部署,和 rollback、latency、observability 放在上线场景里练。
一周训练安排
- 周一:Prompt / Context 词组,练 instruction、constraint、context。
- 周二:Retrieval / Embedding 词组,练 retrieval、embedding、chunk。
- 周三:Inference / Evaluation 词组,练 inference、benchmark、hallucination。
- 周四:Deployment / Monitoring 词组,练 deployment、latency、observability。
- 周五:只清 Review Queue 和高错误词,不扩新词。
- 周末:看 Weekly Report,把退步词写进 3 句真实工作句子。
四种输出场景
- 面试:This system uses retrieval to provide grounded context before inference.
- 技术文档:The reranker improves the relevance of retrieved chunks before they enter the final prompt.
- Prompt 调试:The instruction is too vague, so the model ignores the constraint.
- Issue 描述:The evaluation metric does not capture hallucination in multi-step answers.
一段完整技术说明示例
A user query is converted into an embedding and compared with stored document chunks. The retriever returns candidate passages, and a reranker improves their order before the final prompt is assembled. During inference, the model uses this retrieved context to generate an answer. The result is then evaluated against both relevance and hallucination risk.
这段说明把 query、embedding、retriever、reranker、prompt、inference、evaluation、hallucination 串成一条链。训练目标不是背会每个词,而是能在真实方案说明中自然调用它们。
常见误区
- 把 AI 词汇当成概念表背:概念知道了,但 prompt 或技术方案仍然写不出来。
- 只练名词不练动词:evaluate、retrieve、deploy、monitor 这类动作词更容易进入真实表达。
- 只背热门词不练基础工程词:latency、configuration、rollback、observability 会更频繁出现在实际工作里。
- 只看中文释义不写英文句子:AI Engineer 词汇最终要服务于解释方案、记录实验和沟通问题。
继续往下看的对应页面
常见问题
这和普通英语词库有什么不同?
它更关注技术写作和 AI 工作流里的高频词,目标是让你在写 prompt、读文档和沟通方案时能稳定输入。
适合初学 AI 的人吗?
适合。先从常见的 model、prompt、retrieval、evaluation 这类词开始,逐步扩展到更细的工程词。
为什么这里反复强调 retrieval、inference、evaluation 这些词?
因为这些词不仅高频,而且经常需要被放进技术解释、prompt 调试、方案文档和 issue 描述里,属于“看懂不够,必须会写”的工作词。