大语言模型学习指南

此网页内容主要来自第三方,大部分链接需要科学上网。最近更新:2026年1月

本站链接

LLM前沿动态追踪指南

官网 Official Website

公司/产品描述链接
OpenAI目前最前沿的闭源AI科技公司,GPT-4系列官网
AnthropicClaude系列模型,注重AI安全官网 | Claude
XAI马斯克的AI公司,产品叫Grok官网
Midjourney目前最成功的AIGC图像公司Discord
Stability AI开源众多模型的AI科技公司官网
Mistral AI强大的开源模型提供商,Mixtral系列官网
Google DeepMind谷歌Gemini系列模型官网
Perplexity AI结合搜索引擎的AI问答工具官网
ElevenLabsAI语音合成和克隆官网
Suno AIAI音乐生成官网
PikaAIGC视频官网
RunwayAIGC视频,Gen-3 Alpha官网
LumaAIAIGC 3D和视频,Dream Machine官网
HeyGenAI视频翻译和数字人官网

国内AI公司

公司/产品描述链接
智谱.AIGLM系列模型,清言对话官网
百度文心一言百度的大语言模型官网
阿里通义千问阿里的大语言模型,Qwen系列官网
百川智能国内AI初创公司官网
月之暗面Kimi智能助手官网
零一万物Yi系列模型官网
深度求索DeepSeek系列模型官网
智谱AI开源模型社区ModelScope

论坛 Community

Reddit社区

  • r/ArtificialIntelligence: 泛人工智能的所有信息
  • r/StableDiffusion: AI绘图讨论、报错解决等
  • r/DeepLearning: 深度学习群组
  • r/Artificial: 人工智能前沿资讯
  • r/LocalLLaMA: 本地运行大语言模型社区

其他社区平台

AI新闻追踪 AI News Tracking

名称描述链接
TLDR AI每日AI新闻简报链接
AI SupremacyAI工具和新闻更新链接
Synced全球AI产业新闻链接
VentureBeat AIAI行业新闻和分析链接
MIT AI NewsMIT AI研究新闻链接
机器之心国内AI媒体链接
量子位国内AI科技媒体链接

网站博客 Blog

名称描述链接
Anthropic EngineeringAnthropic官方技术博客链接
OpenAI ResearchOpenAI研究博客链接
DeepLearning.AI Blog吴恩达创办的AI教育平台博客链接
The BatchDeepLearning.AI的每周AI新闻通讯链接
Weights & Biases机器学习实验平台的技术博客链接
Hugging Face Blog最新模型和技术分享链接
BimAnt翻译自国外的最新AI文章链接
Lil'Log语言模型学习资源整理链接

论文 Papers

在线课程平台 Online Courses

Coursera

其他优质平台

  • DeepLearning.AI: 吴恩达创立的AI专业学习平台
  • edX: 哈佛、MIT等名校的AI和机器学习课程
  • Fast.ai: 实用的深度学习课程,注重实践
  • freeCodeCamp: 免费学习AI和机器学习

开发工具 Development Tools

AI编程工具 AI Coding Tools

名称描述链接
Claude CodeAnthropic官方命令行AI编程工具官网
Cursor基于AI的代码编辑器,支持多种模型官网
GitHub CopilotGitHub AI编程助手官网
ClineVS Code AI编程助手插件GitHub
Aider命令行AI编程助手GitHub
Continue开源AI代码助手官网

RAG框架 RAG Frameworks

名称描述链接
LangChain构建基于LLM应用的流行框架链接
LlamaIndex数据索引和检索框架,优化RAG实现链接
LangGraphLangChain的有状态应用框架链接
Haystack端到端RAG框架,用于文档搜索链接
LLMWare企业级RAG管道统一框架链接
PathwayLLM动态RAG框架,支持实时数据同步GitHub
RAGFlow基于深度文档理解的RAG引擎GitHub

MCP协议与工具 MCP Protocol

名称描述链接
MCP (Model Context Protocol)Anthropic推出的AI应用连接标准协议官网
MCP Servers丰富的MCP服务器集合GitHub
FastMCP快速构建MCP服务器的Python框架GitHub

本地部署工具 Local Deployment

名称描述链接
Ollama轻量级本地模型运行工具链接
LM Studio一站式大语言模型运行与测试环境链接
vLLM高性能LLM推理引擎GitHub
llama.cppCPU优化的LLM推理库GitHub
Text Generation WebUI开源LLM Web界面GitHub
LocalAI本地AI模型API服务GitHub
Ollama WebUIOllama的Web界面GitHub

Agent框架 Agent Frameworks

名称描述链接
LangGraph构建有状态multi-actor应用链接
AutoGen微软开发的多智能体对话框架GitHub
CrewAI角色扮演Agent框架GitHub
Semantic Kernel微软开发的LLM集成框架GitHub
MetaGPT多角色Agent框架GitHub
Phidata开源Agent开发框架GitHub

视频博主 Content creators

哔哩哔哩 (B站)

YouTube

频道名称内容特点链接
StanfordOnline吴恩达的各种AI课程链接
FreeCodeCampPyTorch深度课程等链接
Prompt Engineering通用AI信息链接
Olivio SarikasAI绘画信息链接
Aitrepreneur通俗易懂,应用层面链接
3Blue1Brown数学、AI可视化链接
Corbin Brown大语言模型深度应用链接
Scott DetweilerComfyUI教程链接
Two Minute Papers最新AI研究简介链接
SentdexPython和机器学习教程链接
Matt WolfeAI工具和趋势链接

下载模型 AI Models

平台特点链接
CIVITAI全球AI图像模型分享网站链接
LIBLIB国内AI图像模型分享网站链接
Hugging Face深度学习模型分析平台链接
Tusiart国内AI图像模型分享网站链接
ModelScope阿里巴巴开源模型社区链接
OpenLLM Leaderboard开源模型性能榜单链接

Awesome LLM

综合资源列表

最新技术资源

实践建议 Practical Advice

初学者路线图(2026版)

  1. 基础知识学习: Python编程、基础数学(线性代数、概率统计)
  2. 掌握AI编程工具: 学习使用Claude Code、Cursor等AI编程助手
  3. 机器学习入门: 完成吴恩达的机器学习课程或其他入门课程
  4. 深度学习进阶: 学习神经网络和Transformer架构
  5. 实践LLM应用: 使用Claude、GPT等API构建简单应用
  6. 学习RAG技术: 理解检索增强生成原理和实践
  7. 探索Agent开发: 学习使用LangGraph构建有状态AI应用
  8. 参与开源社区: 在GitHub上参与AI开源项目

如何高效使用大语言模型

  1. 学习提示工程: 掌握有效的提示词编写技巧,提高模型输出质量
  2. 组合工具使用: 将LLM与其他工具和API结合,扩展其能力
  3. 批判性评估输出: 始终对模型输出保持批判思考,验证其准确性
  4. 迭代改进: 通过不断调整提示和参数,优化模型表现
  5. 关注最新发展: 定期关注模型更新和新技术,保持知识更新

构建LLM应用的最佳实践(2026版)

  1. 使用AI编程工具: Claude Code、Cursor等工具可大幅提升开发效率
  2. 选择合适的模型: 根据任务复杂度、成本和延迟需求选择模型
  3. 采用RAG架构: 对于需要专业知识或最新信息的应用,优先使用RAG
  4. 利用MCP协议: 通过MCP连接外部服务和数据源
  5. 实现Agent模式: 对于复杂任务,使用LangGraph构建多Agent系统
  6. 评估系统表现: 建立客观的评估指标,持续监控模型表现
  7. 考虑伦理与安全: 注意数据隐私、输出审核和负责任使用
  8. 优化成本: 使用混合策略(简单任务用小模型,复杂任务用大模型)

技术发展趋势

趋势描述代表项目
小型高效模型1B-10B参数的小型模型性能持续提升,推理成本大幅降低Mistral 7B, Qwen2.5, DeepSeek-V3
多模态AI原生多模态模型统一处理文本、图像、音频、视频GPT-4V, Gemini 2.0, Claude 4
Agent架构自主AI代理能够执行复杂任务链,支持工具调用和协作LangGraph, AutoGen, CrewAI
长上下文窗口模型支持越来越长的上下文,从32K扩展到1M+ tokensClaude 4, Gemini 2.0, Grok-2
推理优化量化、蒸馏、MoE等技术让模型更快更便宜GPTQ, AWQ, Mixtral 8x7B
RAG 2.0结合知识图谱、多模态检索的下一代RAG系统GraphRAG, Multi-modal RAG
本地部署普及消费级硬件可运行高质量开源模型Ollama, LM Studio, llama.cpp

应用层趋势

趋势描述
AI编程助手Claude Code、Cursor等工具大幅提升开发效率
MCP协议生态Model Context Protocol统一AI应用连接标准
垂直领域Agent专门化Agent用于编程、数据分析、内容创作等
端侧AI手机、PC等终端设备直接运行AI模型
AI工作流自动化从单次交互转向长期运行的自动化流程
多Agent协作多个AI Agent协同完成复杂任务

2026值得关注的技术

  1. Claude Code: Anthropic推出的命令行AI编程工具,支持MCP协议
  2. DeepSeek-V3: 国产高性能MoE模型,开源社区热烈讨论
  3. MCP (Model Context Protocol): AI应用连接的标准化协议
  4. LangGraph: 构建有状态AI应用的标准框架
  5. RAGFlow: 新一代深度文档理解RAG引擎
  6. vLLM: 高性能推理引擎,大幅降低部署成本

学习建议更新

2026年学习重点

  1. 掌握AI编程工具: Claude Code、Cursor等工具成为必备技能
  2. 学习Agent开发: 理解多Agent协作和状态管理
  3. 理解MCP协议: 参与构建MCP服务器生态
  4. 关注开源模型: Qwen、DeepSeek等国产模型快速崛起
  5. 实践RAG应用: 从简单RAG到GraphRAG、Multi-modal RAG
  6. 学习模型部署: Ollama、vLLM等本地部署技术