【总结01】简单实现RAG的完整流程

张开发

• 2026/4/19 3:46:28 • 15 分钟阅读

分享文章

目录一、什么是 RAG1.1 核心定义1.2 技术原理二、完整流程代码实现一、什么是 RAG1.1 核心定义从本质上讲RAGRetrieval-Augmented Generation是一种旨在解决大语言模型LLM“知其然不知其所以然”问题的技术范式。它的核心是将模型内部学到的“参数化知识”模型权重中固化的、模糊的“记忆”与来自外部知识库的“非参数化知识”精准、可随时更新的外部数据相结合。其运作逻辑就是在 LLM 生成文本前先通过检索机制从外部知识库中动态获取相关信息并将这些“参考资料”融入生成过程从而提升输出的准确性和时效性。一句话总结RAG 就是让 LLM 学会了“开卷考试”它既能利用自己学到的知识也能随时查阅外部资料。1.2 技术原理那么RAG 系统是如何实现“参数化知识”与“非参数化知识”的结合呢如下图所示其架构主要通过两个阶段来完成这一过程1检索阶段寻找“非参数化知识”知识向量化嵌入模型Embedding Model充当了“连接器”的角色。它将外部知识库编码为向量索引Index存入向量数据库。语义召回当用户发起查询时检索模块利用同样的嵌入模型将问题向量化并通过相似度搜索Similarity Search从海量数据中精准锁定与问题最相关的文档片段。2生成阶段融合两种知识上下文整合生成模块接收检索阶段送来的相关文档片段以及用户的原始问题。指令引导生成该模块会遵循预设的Prompt指令将上下文与问题有效整合并引导 LLM如 DeepSeek进行可控的、有理有据的文本生成。二、完整流程代码实现知识库准备【代码】from langchain_community.document_loaders import UnstructuredMarkdownLoader, UnstructuredPDFLoader from langchain_core.prompts import ChatPromptTemplate from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_community.embeddings import HuggingFaceEmbeddings, DashScopeEmbeddings from langchain_core.vectorstores import InMemoryVectorStore from langchain.chat_models import init_chat_model from langchain_core.output_parsers import StrOutputParser from langchain_core.runnables import RunnablePassthrough from dotenv import load_dotenv load_dotenv() # 1.加载本地文档 fil_path C:/Users/Administrator/Desktop/英雄联盟英雄芸阿娜全面介绍.pdf loader UnstructuredPDFLoader(fil_path) docs loader.load() print(docs) # 2.文档切割 spliter RecursiveCharacterTextSplitter( chunk_size300, # 分段的最大字符数 chunk_overlap5, # 分段之间允许重叠的字符数 separators[\n\n, \n, ,。, !, ?, , :, …, —, ], # 分段的依据 length_functionlen # 字符统计依据函数) ) split_docs_chunks spliter.split_documents(docs) print(split_docs_chunks) # 3.构建中文嵌入模型 # embeddings HuggingFaceEmbeddings( # model_nameBAAI/bge-small-zh-v1.5, # model_kwargs{device: cpu}, # 默认使用cpu # encode_kwargs{normalize_embeddings: True} # 对生成的向量进行 L2 归一化 # ) # 这边使用DashScopeEmbeddings embeddings DashScopeEmbeddings( modeltext-embedding-v2 ) # 4.构建向量存储 vectorstore InMemoryVectorStore(embeddings) vectorstore.add_documents(split_docs_chunks) # 添加文档到向量存储中: 将文档转换为向量并存储在内存中 retriever vectorstore.as_retriever( search_kwargs{k: 3} # 搜索时返回的向量数量 ) # 5.构建提示词 prompt ChatPromptTemplate.from_messages( messages[ {role: system, content: 你是一个AI助手,请根据参考资料: {context}回答用户的问题}, {role: human, content: 我的问题是{questions}}, ], ) # 6.初始化模型 model init_chat_model( modeldeepseek-chat, ) # 7. 构建链 str_parser StrOutputParser() def format_docs(docs_list): reference_text [ for doc in docs_list: reference_text doc.page_content reference_text ] return reference_text chain {context: retriever | format_docs, questions: RunnablePassthrough()} | prompt | model | str_parser # 8.调用链 response chain.stream(input介绍一下芸阿娜的基础属性) for chunk in response: print(chunk, end, flushTrue)生成结果

更多文章

前端开发 2026/4/19 3:42:07

代码生成准确率从68%跃升至92.7%的关键转折点，微软/阿里/Anthropic工程师联合验证的4步调优法

第一章：SITS2026圆桌：智能代码生成未来 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026圆桌论坛上，来自GitHub、Tabnine、DeepMind与国内大模型实验室的七位核心研发者共同探讨了智能代码生成从“补全助手”迈向“协同编程伙伴”…

张开发

前端开发 2026/4/19 3:37:41

生成代码没有单元测试？错！用Mutation Testing反向驱动AI补全——1套DSL规则让LLM自动生成带边界覆盖的测试桩（稀缺开源工具首发）

第一章：智能代码生成与代码度量结合 2026奇点智能技术大会(https://ml-summit.org) 智能代码生成已从简单补全迈向上下文感知的语义级产出，而代码度量则为生成结果提供了可量化、可追溯的质量锚点。二者融合并非功能叠加，而是构建“生成—评…

张开发

前端开发 2026/4/19 3:35:28

生升农业全国品牌口碑建设——基于品质与服务的自然传播

品牌全国化发展的核心竞争力，最终体现在品牌口碑上，而良好的品牌口碑，源于稳定的产品品质与专业的服务，而非刻意的营销推广。生升品牌全国化优化过程中，始终坚持“品质为先、服务为本”，通过持续提升产品品…

张开发

前端开发 2026/4/19 3:31:30

ORA-01877: string too long 报错修复与远程处理技巧

修复方法：将日期字符串长度控制在正确格式内，例如使用TO_DATE函数时确保字符串不超过标准长度，如 YYYY-MM-DD HH24:MI:SS 格式。代码示例：SELECT TO_DATE(2023-01-01 12:00:00, YYYY-MM-DD HH24:MI:SS) FROM DUAL; 如果字符串过长…

张开发

前端开发 2026/4/19 3:31:30

冲刺规划管理化技术中的冲刺规划计划冲刺规划实施冲刺规划验证

冲刺规划管理化技术：高效落地的三大核心环节在敏捷开发与项目管理中，冲刺规划管理化技术是确保团队高效协作与目标达成的关键。它以“冲刺规划计划”“冲刺规划实施”“冲刺规划验证”为核心闭环，通过科学分解任务、动态跟踪进度和持续反馈…

张开发

前端开发 2026/4/19 3:30:30

Winhance中文版：让Windows优化变得像驾驶火箭一样简单

Winhance中文版：让Windows优化变得像驾驶火箭一样简单【免费下载链接】Winhance-zh_CN A Chinese version of Winhance. C# application designed to optimize and customize your Windows experience. 项目地址: https://gitcode.com/gh_mirrors/wi/Winhance-zh…

张开发