当前位置：首页 > backend >正文

2022年以来大模型技术及生态发展汇总文档

backend 2025/6/17 7:38:14

2022年以来大模型技术及生态发展汇总

OpenAI 系列
- GPT-3.5、GPT-4（ChatGPT背后的模型，持续迭代，能力大幅提升）
- Whisper（语音识别）、DALL·E（图像生成）、Sora（视频生成）
Google 系列
- PaLM、PaLM2、Gemini（多模态大模型，支持文本、图片、音频等）
- Bard（对话产品）
Meta（Facebook）系列
- LLaMA、LLaMA 2、LLaMA 3（开源大模型，社区广泛应用）
Anthropic
- Claude 1/2/3（对话大模型，强调安全性和可控性）
国内主流
- 百度文心一言（ERNIE Bot）、阿里通义千问、讯飞星火、智谱GLM、商汤日日新、MiniMax、百川、月之暗面Kimi等
开源社区
- MPT、RWKV、Qwen、Yi、ChatGLM、Baichuan、DeepSeek等

RAG（检索增强生成）
结合大模型与知识库/数据库，提升事实性和可控性（如LangChain、LlamaIndex等框架）。
多模态大模型
支持文本、图片、音频、视频等多种输入输出（如GPT-4V、Gemini、Qwen-VL、Sora等）。
模型微调与指令微调（Instruction Tuning）
让大模型更好地理解和执行人类指令，适应特定业务场景。
Agent/智能体技术
让大模型具备自主规划、调用工具、执行任务的能力（如AutoGPT、ChatDev、LangGraph等）。
多智能体协作（Multi-Agent Collaboration）
多个AI智能体协同工作，分工合作解决复杂任务。典型项目如 ChatDev、MetaGPT、CrewAI、OpenAgents 等，推动AI从单体智能向群体智能演进。
MCP协议（Multi-Agent Communication Protocol）
一种用于多智能体间通信与协作的协议，旨在标准化智能体之间的信息交换和任务协作，提升多智能体系统的可扩展性和互操作性。
向量数据库与知识检索
Milvus、Qdrant、Weaviate、Pinecone等，支撑RAG和知识问答。
模型压缩与本地部署
量化、蒸馏、LoRA等技术，让大模型能在本地或边缘设备运行。
安全与可控性
包括内容过滤、对抗攻击防护、隐私保护等。

LangChain、LlamaIndex、Semantic Kernel、RAGFlow、Haystack：用于快速开发RAG、对话、Agent等AI应用。
Dify：开源的低代码/无代码 LLM 应用开发平台，支持可视化编排、知识库、RAG、API集成，适合企业和个人快速搭建AI应用。
HuggingFace Transformers：模型下载、微调、推理的事实标准。
向量数据库：Milvus、Qdrant、Weaviate、Pinecone等。