Published on2026年1月30日FastAPI/Uvicorn 异步服务中使用 multiprocessing.Pool 导致任务取消的问题FastAPIUvicornPython异步编程multiprocessingasyncio深入分析在 FastAPI/Uvicorn 异步服务中使用 multiprocessing.Pool 导致服务器意外关闭的问题,解释 fork 模式与 asyncio 事件循环的冲突机制,并提供使用 ProcessPoolExecutor + spawn 模式的完整解决方案。Read more →
Published on2026年1月29日Agent Lightning:用“可观测执行轨迹”驱动 Agent 的系统化优化(从上手到落地)AIAgentRLPromptTracingObservabilityTraining介绍 Agent Lightning 的定位与核心架构,并给出从易到难的上手路线:先采集轨迹与回放,再做 APO 提示词优化、SFT 微调、VERL 强化学习,最后把它落到真实业务的评估与持续改进闭环。Read more →
Published on2026年1月29日Mem0:给 AI Agent 加上一层“可用的长期记忆”(介绍与上手)AIAgentMemoryLLMRAG从“为什么需要长期记忆”讲起,深入浅出介绍 Mem0 的核心概念与工作流,并给出可直接跑通的 Python 示例与落地建议。Read more →
Published on2026年1月27日从 Ubuntu 到 vLLM:现代大模型推理部署的分层架构详解LLMvLLMvLLM-StackPyTorchCUDA从工程视角拆解 Ubuntu + CUDA + PyTorch + vLLM + Python 的完整推理栈,讲清每一层干什么、数据模型长什么样、以及一次推理请求如何在各层之间流动。Read more →
Published on2026年1月22日LangChain 接入 MCP 示例:构建更智能的上下文感知应用AILangChainMCPLLMPythonTutorial本文详细介绍了如何在 LangChain 框架中集成 Model Context Protocol (MCP),通过具体的代码示例展示如何构建能够动态获取和使用外部上下文的智能应用。Read more →
Published on2026年1月22日LangChain 接入 MCP 实战指南:解锁模型上下文管理新范式AILangChainMCPPythonTutorial本文详细介绍了如何将 LangChain 框架接入 MCP(Model Context Protocol),通过代码示例和最佳实践,帮助开发者高效管理大语言模型的上下文,提升应用性能。Read more →
Published on2026年1月22日LangChain内存管理机制深度解析:从短时对话到长时记忆的架构哲学AILangChainLLMMemory-ManagementLangGraph本文深入剖析LangChain框架中短时内存与长时内存的设计原理、实现机制、应用场景,并结合LangGraph的持久化能力,为构建复杂、可扩展的AI代理提供最佳实践。Read more →
Published on2026年1月15日三次近期问题的事后分析AIInfrastructurePostmortemClaudeReliability详细分析三个间歇性降低 Claude 响应质量的基础设施错误,解释问题原因、检测和修复过程以及改进措施。Read more →
Published on2026年1月15日通过沙箱隔离提升 Claude Code 的安全性和自主性AIAgentSecuritySandboxingClaude-CodeMCP介绍 Claude Code 的两个新沙箱功能:沙箱化 bash 工具和云端 Claude Code,如何通过文件系统和网络隔离提升安全性并减少权限提示。Read more →
Published on2026年1月15日长时间运行智能体的有效框架AIAgentLong-RunningAnthropicClaude-Agent-SDK探讨如何通过初始化智能体和编码智能体的两阶段解决方案,让 Claude Agent SDK 在多个上下文窗口中有效工作。Read more →