从0到1学习AI开发:涵盖RAG,embedding,rerank等技术,助力行业落地

1年前 (2025-01-13)阅读3回复0
网创学长
网创学长
  • 管理员
  • 注册排名1
  • 经验值80735
  • 级别管理员
  • 主题16147
  • 回复0
楼主

课程概览:

这套课程从零开始,带你系统掌握AI开发的核心技术。内容覆盖了RAG(检索增强生成)、Embedding(嵌入)、Rerank(重排序)等关键技术,并结合大量实战案例,帮助你快速将这些技术应用到实际业务中。课程以视频和资料相结合的方式展开,既有理论讲解,也有代码实操,非常适合希望深入行业落地的学习者。

RAG技术详解与实战:

课程从最基础的RAG技术原理讲起,通过RAGFlow项目让你亲手操作,理解检索与生成的结合方式。随后逐步深入,学习高级RAG技巧,比如层次索引、句子窗口、子查询和HyDE(假设文档嵌入)等方法,这些都能有效提升检索质量。你还会接触到模块化RAG,掌握顺序模式、条件模式和分支模式,让RAG系统更加灵活可控。课程最后专门分享了RAG行业落地的实践经验、心得和常见业务场景,帮助你避开坑点。

Embedding与Rerank技术:

这部分内容从Embedding的原理出发,详细讲解了word2vec和CBOW(连续词袋模型)等经典方法。接着,你会学习如何使用LlamaIndex对Embedding模型进行微调,并掌握评估模型效果的方法,比如MRR(平均倒数排名)评测和MTEB(多任务嵌入基准)评测。Rerank技术同样重要,课程区分了交叉编码与双编码两种模式,并带你实践RankGPT等重排序模型的微调,让最终检索结果更精准。

向量数据库与相似性搜索:

课程系统介绍了向量数据库的核心概念,包括欧式距离、余弦相似度等相似性测量方式。你会学习到k-means聚类、肘部法则等经典相似性搜索算法,以及更高效的近似邻近算法,如PQ量化、HNSW和LSH。在选型方面,课程对比了专用向量数据库和传统数据库对向量功能的支持,并通过Chroma和Qdrant的实际代码示例,让你快速上手操作。

大模型微调与部署:

从环境准备开始,课程一步步引导你使用llama-factory进行大模型微调。你会学习到SFT(监督微调)、继续预训练以及偏好优化等数据集准备方法,并实际操作LoRA和QLoRA微调。模型评估部分涵盖了批量推理和自动评估benchmark,最后讲解模型合并、导出与量化,以及本地部署的完整流程,让微调后的模型真正可用。

Agent原理与多Agent架构:

课程首先介绍Agent的基本原理,包括规划(planning)、记忆(memory)和工具使用。接着深入提示词工程,涵盖软提示词、fewshot(少样本学习)和思维链(CoT)等技巧。你会学习到多种Agent设计模式,如Fewshot、ReAct、Reflexion、LAT以及REWOO等。此外,课程还对比了国内外主流Agent平台,并带你用Coze搭建智能客服。在多Agent方面,Langgraph的多Agent协作架构和CrewAI的项目实战,让你理解如何让多个Agent协同工作。

Langchain与Langgraph项目实战:

课程包含Langchain项目的原理与实战讲解,帮助你理解这一框架的核心设计。同时,Langgraph项目也进行了详细拆解,让你掌握如何构建有状态的Agent工作流。AutoGen项目同样被重点介绍,从原理到代码执行和工具使用,让你能够快速搭建自己的多Agent系统。

AI基础与开发环境:

课程从人工智能的迭代路径、大模型进化树和技术分类讲起,帮助你建立宏观认知。同时,介绍了柏拉图表征假说和Scaling Law(规模定律)等关键理论。开发环境部分,手把手教你配置Python、Conda和VSCode,确保后续学习顺利进行。整套课程内容层层递进,既有理论深度,又有实践广度,是你从0到1掌握AI开发的不错选择。

会员资源

会员用户免费查看此资源升级会员

0
回帖

从0到1学习AI开发:涵盖RAG,embedding,rerank等技术,助力行业落地 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息