分类: AI

2026-04-08 AI

我理解的几种Agent核心设计模式：从ReAct到Memory

一、前言这两年 Agent 相关的概念很多，论文、框架、术语一层套一层，刚开始看会有一种感觉：好像什么都重要，但真到工程里，又很难判断哪些东西值得先学，哪些东西只是阶段性热词。我自己更倾向于换一种看法：不要把 Agent 先当成一堆论文名词，而是先把它看成几个反复出现的工程设计模式。如果把视角拉回系统实现，很多东西其实没那么玄。Agent 不是“接个大模型 + 调几个工具”就结束了，它最后还是...

阅读全文

#Agent #大模型 #ReAct

2022-03-19 AI

一个小游戏入门深度强化学习

用深度强化学习算法 deep Q-learning 玩 CartPole 游戏。强化学习是机器学习的一个重要分支，通过强化学习我们可以创建一个 agent，让它与环境不断地互动，不断试错，自主地从中学习到知识，进而做出决策。如图所示，agent 收到环境的状态 state，做出行动 action，行动后会得到一个反馈，反馈包括奖励 reward 和环境的下一个状态 next_state。这样...

阅读全文

#DRL

2021-10-03 AI

从0到1构建一套Chatbot

一、前言1.1 交互的趋势让机器去适应人, 人不是人是适应机器任何产品都需要依赖对话系统为之赋能, 未来, 对话系统将可能成为重要的人机交互窗口. 这一切,都可以从设计一个小的封闭域Chatbot开始——LuQi. 举个例子: “帮我查一下明天或者后天,晚上最便宜的去上海的机票”, 从用户的操作和实际体验来看, 图形交互无法一次给出结果, 用户需要先打开App, 先查一次明天机票再查一次后天...

阅读全文

#对话机器人