Hello-Agents第一章习题 #195

Lucy-cao · 2025-11-26T00:29:19Z

Lucy-cao
Nov 26, 2025

caseA属于反应式智能体，它是基于工程师已经设计到的条件-行动进行决策的，没有自主规划的能力。
caseB属于基于模型的反应式智能体，它能够检测到外部世界的状态，理解并构建外部世界的模型，基于环境做出决策。
caseC属于规划式智能体，也是基于效用的智能体，具备一定的思考能力和长远规划的能力，会考虑未来如何走是最优策略。
caseD属于混合式智能体，查询订单信息、分析问题原因是思考的过程，提供解决方案是思考的结果，并能够安抚用户情绪是通过观察做出安抚的反应，所以属于混合式智能体。
Performance性能度量：①用户能够达到既定的健身目标。②训练计划是适合不同健身基础的用户的。③动作指导标准，降低运动损伤率。④饮食建议合理，能够为用户的目标服务。
Environment环境：①物理环境：用户所处的运动场所。②用户身体：生理状态（心率、血氧、动作形态等）和心理状态（动力、疲劳感）。③用户设备：可穿戴设备等。④数据平台：保存用户运动、饮食等数据的云端服务器。
Actuators执行器：①生成训练计划给用户查看。②监测用户的生理数据和健身过程的运动形态，展示给用户。③提供语音指导，如果不标准则给出纠正动作的提示。④展示训练效果和饮食建议。
Sensors传感器：①可穿戴设备监测用户心率、血氧等数据。②视觉传感器捕获用户的运动形态，并进行计算机视觉分析。③用户输入数据：健身目标、心理状态、疼痛反馈等。④周围的环境：地理位置、海拔信息等。
部分可观察：用户的健身目标、通过可穿戴设备监测到的身体数据、训练动作的形态都是可以观察的。
随机性和动态性：①用户的生理数据指标是随机性和动态变化的，当心率过高或者血氧过低，需要及时提醒用户休息。②用户的运动形态也会在过程中不断变化，智能体需要根据变化去判断动作是否标准，如果不标准，需要及时的纠正。
①方案A：优点：按照既定的目标条件执行，不会出错，能够快速响应结果；缺点：缺乏一定的灵活性。
方案B：优点：自动根据用户的历史行为判断是否可以退款，对于优质客户而言，不再需要等审批，体验较好，具备很强的灵活性。缺点：对于一些需要严格把关退款的特殊商品或者金额较高的商品，可能出现机器误判的情况，对公司造成一定的损失。
②Workflow适用场景：商品价值较高或者特殊商品之类的退款需要人工审核。Agent适用场景：普通商品且商品价值不高，客户历史购买行为较好时，可以使用Agent。
我倾向于两者结合起来使用。
③可以将两者结合。首先通过智能体判断商品的情况和用户的情况，如果涉及到特殊商品或者商品金额较大，则交由工作流让人工介入做出判断。
①在每一次给出推荐的结果时，提醒用户做出反馈对此结果是满意还是不满意，将用户的反馈记录下来，加入到下一次对话时的输入词中，这就相当于智能体有了记忆的功能。
②这需要联网调用API查询景点门票的余额情况，如果查询到售罄，那么通知智能体生成备选方案。
③在提示词中可以加入提示语：如果用户连续拒绝3个推荐，那么一方面可以总结用户拒绝的景点类型，尽量避免此类，推荐其他类型的景点，同时也可以询问客户对哪类景点更感兴趣，后续以此作为着重推荐类型。
以医疗诊断助手为例，当接收到一个患者时，需要获取到患者的不适描述，之前做的各种检查报告，由系统1快速初筛，判断大致是哪种类型的疾病，如果是普通的病例，那么就直接输出诊断结果；
如果是碰到复杂的或罕见的疾病，那么需要启动系统2，对检查报告中更详细的指标做出分析，也有可能需要调用最新的研究报告，判断是否是罕见疾病，慢慢推理出所患疾病，并给出针对性的解决方案。
①智能体是基于上下文根据概率去判断后续可能输出的内容的，只要是概率问题，就会存在误判；另一方面，互联网上信息繁杂，不一定所有的信息都是真实的，如果用于训练的数据源不准确，那么模型产出的结果也会是不正确的。
②智能体可能会陷入死循环中，如果没有得到应有的答案，可能会一直循环，无法停止。
③仅仅使用准确率是不够的，准确率只能够对已有数据集进行验证准确率，但是无法确保对于未知的内容适用成都，需要更加完整的框架去评估智能程度。
效能与可靠性：准确率只是一个起点。需要更关心它的召回率和在不同场景中的鲁棒性。
效率：计算需要多少时间和内存，目标结果与计算耗用资源之间是否平衡。
泛化性：是不是可以对其他未被纳入训练集的数据也能够有较好的结果。
推理能力：能否体现了其因果推理能力，让用户可视化推理的过程。
交互性：它给出的建议是否被用户接纳，用户所输入的内容，是否可以作为后续提供建议的基础。

jerryoung · 2025-11-26T15:54:35Z

jerryoung
Nov 26, 2025

我感觉caseA 不是智能体哈

14 replies

matrixcloud Mar 19, 2026

我觉得是，这是非 LLM 范式下的智能体，工程师通过在计算机里面设定 workflow，比如计算机开机后打开浏览器，然后播放音乐。这个 workflow 是死的，但是也是自主执行了。非 LLM 范式下的智能体只能通过人工编排，而 LLM 范式下的智能体相当拥有了一个大脑，只需简单模糊的指令，能够感知外界环境，自主通过大脑理解判断接下来的步骤，而非定死的。

baizeAI-Pro Mar 26, 2026

+1，智能体还是要有自主完成任务的能力，有记忆与反思

linxiecoder Mar 27, 2026

按课程中描述，他应该属于传统意义下的智能体-反射智能体，不是大模型背景下的反应智能体。
反射智能体是无环境感知能力的

selma0817 Mar 27, 2026

+1, case A 对于智能体来说感觉缺乏了思考部分，只有感知（或许输入可以在这里当成感知），和行动。

qingzheng-web Apr 4, 2026

没有自主决策能力，不符合智能体的定义，故caseA不是智能体

Linshijing · 2026-01-15T15:04:36Z

Linshijing
Jan 15, 2026

智能体通过理解用户意图去自主选择工具，那如果这个工具没有，比如查询天气的这个函数没有提供给他，他就不能自己写一个函数去查天气吗？如果是这样，就是提前提供一大堆工具，如果是开发通用性智能体。

1 reply

zzma-pixel Mar 22, 2026

应该是可以的，但如果碰到需要api-key的工具，还是得由人来配置

yany0804 · 2026-03-10T07:11:10Z

yany0804
Mar 10, 2026

caseB的主体应该属于混合式智能体？

2 replies

yany0804 Mar 10, 2026

毕竟主体是自动驾驶系统，还有路径规划等功能

linxiecoder Mar 27, 2026

我理解，基于Case来，Case中只描述了前方有障碍物，决策刹车还是变道。没有对于长期规划的描述。所以这道题认为他是规划式智能体。

guoguoq3 · 2026-03-29T14:28:56Z

guoguoq3
Mar 29, 2026

caseA 感觉不是智能体智能体的核心是：感知环境 → 自主决策 → 执行动作的闭环超级计算机只是高性能计算设备，没有自主感知环境、没有自主目标、不会主动行动，只能被动执行程序指令

0 replies

Boer-1 · 2026-04-10T08:41:12Z

Boer-1
Apr 10, 2026

习题1：

case A：冯·诺依曼结构的计算机不属于智能体，因为

智能体并非只是被动响应外部刺激或严格执行预设指令的程序，它能够基于其感知和内部状态进行独立决策，以达成其设计目标

case B：特斯拉自动驾驶系统属于智能体:基于模型的反射智能体（Model-Based Reflex Agent）;反应式智能体 (Reactive Agents);神经符号主义 AI。因为：

一辆在隧道中行驶的自动驾驶汽车，即便摄像头暂时无法感知到前方的车辆，它的内部模型依然会维持对那辆车存在、速度和预估位置的判断。这个内部模型让智能体拥有了初级的“记忆”，使其决策不再仅仅依赖于瞬时感知，而是基于一个更连贯、更完整的世界状态理解。
对环境刺激做出近乎即时的响应，决策延迟极低。

case C：AlphaGo属于智能体：基于效用的智能体（Utility-Based Agent）;学习型智能体（Learning Agent）;规划式智能体(Deliberative Agents);亚符号主义 AI（Sub-symbolic AI）.因为：

智能体的核心目标不再是简单地达成某个特定状态，而是最大化期望效用
当它最终赢下一局时，系统会给予它一个正向的奖励。通过大量的自我对弈，学习元件会逐渐发现哪些棋路更有可能导向最终的胜利

case D：ChatGPT 扮演的智能客服属于智能体：基于效用的智能体（Utility-Based Agent）;混合式智能体(Hybrid Agents);神经符号主义 AI（Neuro-Symbolic AI）.因为：

智能体的核心目标不再是简单地达成某个特定状态，而是最大化期望效用。它需要回答一个更复杂的问题：“哪种行为能为我带来最满意的结果？”。这种架构让智能体学会在相互冲突的目标之间进行权衡，使其决策更接近人类的理性选择

习题2：

"智能健身教练"的任务环境：
性能度量(Performance)：在尽量短且合理的时间内，指导用户完成瘦身增肌等健身目标。
环境(Environment)：可穿戴设备传感器数据，手机摄像头，用户身体素质指标。
执行器(Actuators)：app界面显示动作规范、饮食建议，调用麦克风提供语音指导
传感器(Sensors)：分析用户运动状态、动作标准，评估训练效果

习题3：

方案一优点：开发成本小，见效快，逻辑直观；缺点：比较僵硬，不能评估具体售后案例是买房过错还是卖方过错，一刀切。
方案二优点：更人性化，可根据用户历史行为，等分辨“是非”，代表大众理论道德；缺点：开发调试难，上线效果不如预期。
Workflow适合客观场景，商品是标准件，比如五金器材，书籍，游戏，模型等；
Agent适合主观、成本可控场景，比如大众服饰，水果生鲜等。
或许存在方案C：小额交易直接走Agent，500百元以上设计Workflow流程，往后逐渐替代固定流程。

习题4：

1、添加一个"记忆"功能：把用户偏好信息添加到AGENT_SYSTEM_PROMPT或者持久化添加到prompt_history
2、当推荐的景点门票已售罄：添加查询余票API到可用工具；修改user_prompt，补充“推荐有余票的景区”，来提示LLM。
3、如果用户连续拒绝了 3 个推荐：补充用户拒绝的景区到prompt_history；补充AGENT_SYSTEM_PROMPT命令LLM三次失败重新调整。

习题5：

医疗诊断助手：治疗方案的制定由系统1处理，病情分析，生理指标超标等由系统2处理。系统1统筹计划，拆解目标任务为实现步骤，由系统2执行，来完成协同工作。

习题6：

1、产生"幻觉"：本身就是词向量间距推理，智能体或许学习不到位，没掌握主次因果细节，给出相关但错误的结论也属正常。
2、最大循环次数为 5 次：可能卡在某个失效API始终完不成任务，或者浪费资源
3、智能程度：仅看准确率不够，得兼顾效率和推理能力，即智能程度高的智能体应该是，思路越清晰高效，完成任务又快又准，甚至超出预设答案水平。

2 replies

Skadi2333215 Apr 16, 2026

系统1系统2是不是弄反了

Boer-1 Apr 17, 2026

你是对的，我弄反了，应该是：

系统1负责“提出可能性”，系统2负责“验证与决策”，二者协同完成诊断流程。

系统1（直觉）负责：症状理解（NLP）、医学影像识别、疾病候选生成（初步判断）、风险预测（概率模型）
系统2（推理）负责：病情分析（结合规则/指南）、生理指标判定（是否超标、是否危险）、治疗方案制定（核心决策）、合规校验（禁忌、剂量、安全）

Hello-Agents第一章习题 #195

Uh oh!

Replies: 5 comments · 19 replies

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

习题1：

习题2：

习题3：

习题4：

习题5：

习题6：

Uh oh!

Uh oh!

Replies: 5 comments 19 replies