task01 exercise #146
Unanswered
Ohyaxy
asked this question in
💬 Exercises & Q&A
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
case A:不属于智能体。理由在于它只是一台拥有强大计算能力的机器,但本身没有自主性、目标导向性或与环境的交互能力。它需要由人类或程序来驱动,完成特定的计算任务,本身不具备智能体的基本特征。
case B:属于反应型智能体。从结构维度看,它是纯反应型的,因为高速行驶中遇到障碍物,没有时间进行内部推理,必须基于预设规则(条件-动作规则)立即做出反应。从能力维度看,它属于实时控制型。从环境维度看,它处于动态(道路情况瞬息万变)、部分可观察(传感器视野有限)的环境中。
case C:属于慎思型智能体。从结构维度看,它是基于模型的慎思型,因为它需要构建一个内部棋盘模型,进行深度的搜索和推理,规划未来数十步的策略。从能力维度看,它属于规划决策型。从环境维度看,围棋棋盘是一个静态(对手落子后棋盘状态才改变)、完全可观察(所有棋子信息都对等)的离散环境。
case D:属于混合型智能体。从结构维度看,它是混合型,因为它既需要快速理解用户情绪并做出安抚(反应性),又需要查询订单、分析问题原因进行逻辑推理(慎思性)。从能力维度看,它属于交互对话型。从环境维度看,它处于动态(用户情绪和问题在变化)、部分可观察(无法完全了解用户所有背景信息)的多模态(处理文本、可能还有图片等)环境中。
PEAS 描述:
性能指标:用户健身目标达成度、运动安全性、用户满意度、训练计划依从性。
环境:用户的生理状态(心率、血氧、动作姿态)、运动环境(家庭、健身房)、可穿戴设备数据、用户的语音和手动反馈。
执行器:语音指导输出、屏幕显示内容、训练计划调整指令、饮食建议文档生成。
传感器:心率监测器、加速度计/陀螺仪、GPS、用户语音输入、手动反馈按钮/触屏输入。
环境特性分析:
这个环境是部分可观察的,因为教练无法完全知晓用户的疲劳程度、肌肉酸痛感等主观感受。
它具有随机性,用户的身体反应、对训练计划的适应程度、甚至是否听从指导都存在不确定性。
环境是动态的,用户的心率、体力在运动过程中持续变化,需要系统实时响应。
时间和状态都是连续的,因此是连续环境。
系统中只有一个主要的决策主体(健身教练),所以是单智能体环境。
动作效果相对可预测,例如让用户休息心率就会下降,因此基本是确定性的。
每个训练会话可以看作一个相对独立的情节。
方案A(Workflow)的优点是规则明确,任何客服都能按章操作,执行标准统一,结果易于审计和预测,且开发和维护成本较低。它的缺点是缺乏灵活性,无法处理规则之外的复杂或特殊情況,用户体验比较僵化,可能因为规则死板而损失有价值的客户。
方案B(Agent)的优点是能够灵活决策,可以进行个性化处理,比如考虑用户的信誉和历史行为,并且能够通过数据学习不断优化决策。它的缺点是决策过程像一个"黑箱",不透明,难以解释和审计,可能存在难以察觉的偏见,而且初期开发和持续的模型维护成本很高。
在规则明确、风险敏感、需要严格合规的场景下,Workflow更合适。在情况复杂、需要个性化处理、有大量规则难以覆盖的边缘案例时,Agent更有优势。
如果我是该电商公司的负责人,我更倾向于采用一种混合方案,即方案C。具体做法是:首先,设计一套基础Workflow来处理大部分简单、低风险、规则明确的退款申请,这样可以保证效率和一致性。然后,对于复杂、高金额或触及规则边界的案例,交由Agent系统进行分析,它可以给出批准或拒绝的建议及理由,但最终决策权交给人工审核员。同时,系统会记录所有Agent的建议和人工的最终决策,这些数据可以用来训练和优化Agent,并反过来审视和优化基础Workflow的规则,形成一个不断进化的系统。
Beta Was this translation helpful? Give feedback.
All reactions