大语言模型学习指南

Table of Contents

此网页内容主要来自第三方,大部分链接需要科学上网。最近更新:2024年11月

本站链接

LLM前沿动态追踪指南

官网 Official Website

公司/产品描述链接
OpenAI目前最前沿的闭源AI科技公司官网
XAI马斯克的AI公司,产品叫Grok官网
ClaudeAnthropic开发的大语言模型官网
Midjourney目前最成功的AIGC图像公司Discord
Stability AI开源众多模型的AI科技公司官网
PikaAIGC视频(收费)官网
RunwayAIGC视频(收费)官网
PixverseAIGC视频(目前免费)官网
LumaAIAIGC3D(目前免费)官网
谷歌 Gemini谷歌的大语言模型官网
智谱.AI国内AI公司官网
百度文心一言百度的大语言模型官网
阿里通义千问阿里的大语言模型官网
百川智能国内AI初创公司官网
Mistral AI强大的开源模型提供商官网
Perplexity AI结合搜索引擎的AI问答工具官网

论坛 Community

Reddit社区

  • r/ArtificialIntelligence: 泛人工智能的所有信息
  • r/StableDiffusion: AI绘图讨论、报错解决等
  • r/DeepLearning: 深度学习群组
  • r/Artificial: 人工智能前沿资讯
  • r/LocalLLaMA: 本地运行大语言模型社区

其他社区平台

网站博客 Blog

名称描述链接
BimAnt翻译自国外的最新AI文章链接
DeepLearning.AI Blog吴恩达创办的AI教育平台博客链接
The BatchDeepLearning.AI的每周AI新闻通讯链接
Weights & Biases机器学习实验平台的技术博客链接
Hugging Face Blog最新模型和技术分享链接

论文 Papers

在线课程平台 Online Courses

Coursera

其他优质平台

  • DeepLearning.AI: 吴恩达创立的AI专业学习平台
  • edX: 哈佛、MIT等名校的AI和机器学习课程
  • Fast.ai: 实用的深度学习课程,注重实践
  • freeCodeCamp: 免费学习AI和机器学习

开发工具 Development Tools

RAG框架 RAG Frameworks

名称描述链接
LangChain构建基于LLM应用的流行框架链接
LlamaIndex数据索引和检索框架,优化RAG实现链接
Haystack端到端RAG框架,用于文档搜索链接
LLMWare企业级RAG管道统一框架链接
PathwayLLM动态RAG框架,支持实时数据同步GitHub

本地部署工具 Local Deployment

名称描述链接
Ollama轻量级本地模型运行工具链接
LangserveLangChain应用的服务部署工具GitHub
LM Studio一站式大语言模型运行与测试环境链接
Semantic Kernel微软开发的LLM集成框架GitHub

视频博主 Content creators

哔哩哔哩 (B站)

YouTube

频道名称内容特点链接
StanfordOnline吴恩达的各种AI课程链接
FreeCodeCampPyTorch深度课程等链接
Prompt Engineering通用AI信息链接
Olivio SarikasAI绘画信息链接
Aitrepreneur通俗易懂,应用层面链接
3Blue1Brown数学、AI可视化链接
Corbin Brown大语言模型深度应用链接
Scott DetweilerComfyUI教程链接
Two Minute Papers最新AI研究简介链接
SentdexPython和机器学习教程链接
Matt WolfeAI工具和趋势链接

下载模型 AI Models

平台特点链接
CIVITAI全球AI图像模型分享网站链接
LIBLIB国内AI图像模型分享网站链接
Hugging Face深度学习模型分析平台链接
Tusiart国内AI图像模型分享网站链接
ModelScope阿里巴巴开源模型社区链接
OpenLLM Leaderboard开源模型性能榜单链接

Awesome LLM

实践建议 Practical Advice

初学者路线图

  1. 基础知识学习: 先学习Python编程和基础数学知识(线性代数、概率统计)
  2. 机器学习入门: 完成吴恩达的机器学习课程或其他入门课程
  3. 深度学习进阶: 学习神经网络和深度学习的基本原理
  4. LLM专项学习: 了解Transformer架构、自监督学习和迁移学习
  5. 实践项目: 尝试使用开源模型构建简单应用,如聊天机器人或文本分类

如何高效使用大语言模型

  1. 学习提示工程: 掌握有效的提示词编写技巧,提高模型输出质量
  2. 组合工具使用: 将LLM与其他工具和API结合,扩展其能力
  3. 批判性评估输出: 始终对模型输出保持批判思考,验证其准确性
  4. 迭代改进: 通过不断调整提示和参数,优化模型表现
  5. 关注最新发展: 定期关注模型更新和新技术,保持知识更新

构建LLM应用的最佳实践

  1. 先明确用例: 在选择技术栈前,明确应用的具体需求和目标
  2. 选择合适的模型: 根据任务复杂度、资源限制和性能需求选择模型
  3. 采用RAG架构: 对于需要专业知识或最新信息的应用,考虑使用检索增强生成
  4. 评估系统表现: 建立客观的评估指标,持续监控模型表现
  5. 考虑伦理与安全: 注意数据隐私、输出审核和责任使用
趋势描述
小型高效模型如Mistral和Phi等小型但高效的模型正变得越来越流行
多模态AI结合文本、图像、音频和视频的多模态模型持续发展
Agent架构自主AI代理能够执行复杂任务链的研究和应用正在兴起
本地部署随着模型体积缩小和量化技术改进,本地运行LLM变得更加可行
特定领域微调针对特定行业和任务的专业化模型将会增多