我理解的几种Agent核心设计模式:从ReAct到Memory
一、前言这两年 Agent 相关的概念很多,论文、框架、术语一层套一层,刚开始看会有一种感觉:好像什么都重要,但真到工程里,又很难判断哪些东西值得先学,哪些东西只是阶段性热词。 我自己更倾向于换一种看法:不要把 Agent 先当成一堆论文名词,而是先把它看成几个反复出现的工程设计模式。 如果把视角拉回系统实现,很多东西其实没那么玄。Agent 不是“接个大模型 + 调几个工具”就结束了,它最后还是...
用深度强化学习算法 deep Q-learning 玩 CartPole 游戏。 强化学习是机器学习的一个重要分支,通过强化学习我们可以创建一个 agent,让它与环境不断地互动,不断试错,自主地从中学习到知识,进而做出决策。 如图所示,agent 收到环境的状态 state,做出行动 action,行动后会得到一个反馈,反馈包括奖励 reward 和环境的下一个状态 next_state。 这样...
一、前言1.1 交互的趋势 让机器去适应人, 人不是人是适应机器 任何产品都需要依赖对话系统为之赋能, 未来, 对话系统将可能成为重要的人机交互窗口. 这一切,都可以从设计一个小的封闭域Chatbot开始——LuQi. 举个例子: “帮我查一下明天或者后天,晚上最便宜的去上海的机票”, 从用户的操作和实际体验来看, 图形交互无法一次给出结果, 用户需要先打开App, 先查一次明天机票再查一次后天...