我理解的几种Agent核心设计模式:从ReAct到Memory
一、前言这两年 Agent 相关的概念很多,论文、框架、术语一层套一层,刚开始看会有一种感觉:好像什么都重要,但真到工程里,又很难判断哪些东西值得先学,哪些东西只是阶段性热词。 我自己更倾向于换一种看法:不要把 Agent 先当成一堆论文名词,而是先把它看成几个反复出现的工程设计模式。 如果把视角拉回系统实现,很多东西其实没那么玄。Agent 不是“接个大模型 + 调几个工具”就结束了,它最后还是...
用深度强化学习算法 deep Q-learning 玩 CartPole 游戏。 强化学习是机器学习的一个重要分支,通过强化学习我们可以创建一个 agent,让它与环境不断地互动,不断试错,自主地从中学习到知识,进而做出决策。 如图所示,agent 收到环境的状态 state,做出行动 action,行动后会得到一个反馈,反馈包括奖励 reward 和环境的下一个状态 next_state。 这样...
好久不用hexo,发现一堆问题, 记录如下: Mac OS上搭建Hexo博客流程 https://juejin.cn/post/6978377036645531662#heading-0 remote: Support for password authentication was removed on August 13, 2021. https://blog.csdn.net/weixi...
一、前言1.1 交互的趋势 让机器去适应人, 人不是人是适应机器 任何产品都需要依赖对话系统为之赋能, 未来, 对话系统将可能成为重要的人机交互窗口. 这一切,都可以从设计一个小的封闭域Chatbot开始——LuQi. 举个例子: “帮我查一下明天或者后天,晚上最便宜的去上海的机票”, 从用户的操作和实际体验来看, 图形交互无法一次给出结果, 用户需要先打开App, 先查一次明天机票再查一次后天...
BIO,同步阻塞式IO,简单理解:一个连接一个线程(适合稳定少数连接) NIO,同步非阻塞IO,简单理解:一个请求一个线程: 标准/典型的Reactor(适合大量短链接) AIO,异步非阻塞IO,简单理解:一个有效请求一个线程:改进实现的Proactor(适合长重操作,代价是新启线程) BIO里用户最关心”我要读”,NIO里用户最关心”我可以读了”,在AIO模型里用户更需要关注的是”读完...
OceanBase(中文名”海钡云”)是阿里巴巴/蚂蚁金服自主研发的面向云时代的关系数据库,目前,OceanBase已经应用于蚂蚁金服会员、交易、支付、账务、计费等核心系统和网商银行等业务系统,同时也支撑着双11用户每一笔订单背后的数据和事务处理,在阿里电商、金融、云服务领域大放异彩。 123456789- 可扩展,分布式系统,支持ACID、无缝扩容,兼具分布式系统与关系型数据库的优点。...