Hello-Agents第一章习题 #195
Replies: 5 comments 19 replies
-
|
我感觉caseA 不是智能体哈 |
Beta Was this translation helpful? Give feedback.
-
|
智能体通过理解用户意图去自主选择工具,那如果这个工具没有,比如查询天气的这个函数没有提供给他,他就不能自己写一个函数去查天气吗?如果是这样,就是提前提供一大堆工具,如果是开发通用性智能体。 |
Beta Was this translation helpful? Give feedback.
-
|
caseB的主体应该属于混合式智能体? |
Beta Was this translation helpful? Give feedback.
-
|
caseA 感觉不是智能体 智能体的核心是:感知环境 → 自主决策 → 执行动作 的闭环 超级计算机只是高性能计算设备,没有自主感知环境、没有自主目标、不会主动行动,只能被动执行程序指令 |
Beta Was this translation helpful? Give feedback.
-
习题1:case A:冯·诺依曼结构的计算机不属于智能体,因为
case B:特斯拉自动驾驶系统属于智能体:基于模型的反射智能体(Model-Based Reflex Agent);反应式智能体 (Reactive Agents);神经符号主义 AI。因为:
case C:AlphaGo属于智能体:基于效用的智能体(Utility-Based Agent);学习型智能体(Learning Agent);规划式智能体(Deliberative Agents);亚符号主义 AI(Sub-symbolic AI).因为:
case D:ChatGPT 扮演的智能客服属于智能体:基于效用的智能体(Utility-Based Agent);混合式智能体(Hybrid Agents);神经符号主义 AI(Neuro-Symbolic AI).因为:
习题2:"智能健身教练"的任务环境: 习题3:方案一优点:开发成本小,见效快,逻辑直观; 缺点:比较僵硬,不能评估具体售后案例是买房过错还是卖方过错,一刀切。 习题4:1、添加一个"记忆"功能:把用户偏好信息添加到AGENT_SYSTEM_PROMPT或者持久化添加到prompt_history 习题5:医疗诊断助手:治疗方案的制定由系统1处理,病情分析,生理指标超标等由系统2处理。系统1统筹计划,拆解目标任务为实现步骤,由系统2执行,来完成协同工作。 习题6:1、产生"幻觉":本身就是词向量间距推理,智能体或许学习不到位,没掌握主次因果细节,给出相关但错误的结论也属正常。 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
caseA属于反应式智能体,它是基于工程师已经设计到的条件-行动进行决策的,没有自主规划的能力。
caseB属于基于模型的反应式智能体,它能够检测到外部世界的状态,理解并构建外部世界的模型,基于环境做出决策。
caseC属于规划式智能体,也是基于效用的智能体,具备一定的思考能力和长远规划的能力,会考虑未来如何走是最优策略。
caseD属于混合式智能体,查询订单信息、分析问题原因是思考的过程,提供解决方案是思考的结果,并能够安抚用户情绪是通过观察做出安抚的反应,所以属于混合式智能体。
Performance性能度量:①用户能够达到既定的健身目标。②训练计划是适合不同健身基础的用户的。③动作指导标准,降低运动损伤率。④饮食建议合理,能够为用户的目标服务。
Environment环境:①物理环境:用户所处的运动场所。②用户身体:生理状态(心率、血氧、动作形态等)和心理状态(动力、疲劳感)。③用户设备:可穿戴设备等。④数据平台:保存用户运动、饮食等数据的云端服务器。
Actuators执行器:①生成训练计划给用户查看。②监测用户的生理数据和健身过程的运动形态,展示给用户。③提供语音指导,如果不标准则给出纠正动作的提示。④展示训练效果和饮食建议。
Sensors传感器:①可穿戴设备监测用户心率、血氧等数据。②视觉传感器捕获用户的运动形态,并进行计算机视觉分析。③用户输入数据:健身目标、心理状态、疼痛反馈等。④周围的环境:地理位置、海拔信息等。
部分可观察:用户的健身目标、通过可穿戴设备监测到的身体数据、训练动作的形态都是可以观察的。
随机性和动态性:①用户的生理数据指标是随机性和动态变化的,当心率过高或者血氧过低,需要及时提醒用户休息。②用户的运动形态也会在过程中不断变化,智能体需要根据变化去判断动作是否标准,如果不标准,需要及时的纠正。
①方案A:优点:按照既定的目标条件执行,不会出错,能够快速响应结果;缺点:缺乏一定的灵活性。
方案B:优点:自动根据用户的历史行为判断是否可以退款,对于优质客户而言,不再需要等审批,体验较好,具备很强的灵活性。缺点:对于一些需要严格把关退款的特殊商品或者金额较高的商品,可能出现机器误判的情况,对公司造成一定的损失。
②
Workflow适用场景:商品价值较高或者特殊商品之类的退款需要人工审核。Agent适用场景:普通商品且商品价值不高,客户历史购买行为较好时,可以使用Agent。我倾向于两者结合起来使用。
③可以将两者结合。首先通过智能体判断商品的情况和用户的情况,如果涉及到特殊商品或者商品金额较大,则交由工作流让人工介入做出判断。
①在每一次给出推荐的结果时,提醒用户做出反馈对此结果是满意还是不满意,将用户的反馈记录下来,加入到下一次对话时的输入词中,这就相当于智能体有了记忆的功能。
②这需要联网调用API查询景点门票的余额情况,如果查询到售罄,那么通知智能体生成备选方案。
③在提示词中可以加入提示语:如果用户连续拒绝3个推荐,那么一方面可以总结用户拒绝的景点类型,尽量避免此类,推荐其他类型的景点,同时也可以询问客户对哪类景点更感兴趣,后续以此作为着重推荐类型。
以医疗诊断助手为例,当接收到一个患者时,需要获取到患者的不适描述,之前做的各种检查报告,由系统1快速初筛,判断大致是哪种类型的疾病,如果是普通的病例,那么就直接输出诊断结果;
如果是碰到复杂的或罕见的疾病,那么需要启动系统2,对检查报告中更详细的指标做出分析,也有可能需要调用最新的研究报告,判断是否是罕见疾病,慢慢推理出所患疾病,并给出针对性的解决方案。
①智能体是基于上下文根据概率去判断后续可能输出的内容的,只要是概率问题,就会存在误判;另一方面,互联网上信息繁杂,不一定所有的信息都是真实的,如果用于训练的数据源不准确,那么模型产出的结果也会是不正确的。
②智能体可能会陷入死循环中,如果没有得到应有的答案,可能会一直循环,无法停止。
③仅仅使用准确率是不够的,准确率只能够对已有数据集进行验证准确率,但是无法确保对于未知的内容适用成都,需要更加完整的框架去评估智能程度。
效能与可靠性: 准确率只是一个起点。需要更关心它的召回率和在不同场景中的鲁棒性。
效率: 计算需要多少时间和内存,目标结果与计算耗用资源之间是否平衡。
泛化性: 是不是可以对其他未被纳入训练集的数据也能够有较好的结果。
推理能力: 能否体现了其因果推理能力,让用户可视化推理的过程。
交互性: 它给出的建议是否被用户接纳,用户所输入的内容,是否可以作为后续提供建议的基础。
Beta Was this translation helpful? Give feedback.
All reactions