卡顿
昨天电脑在执行我的dbq命令(一个基于Playwright的数据库自动化查询CLI)时突然卡顿了。 卡顿这件事对程序来说不算什么,但对人类来说还挺烦的。我们生活的现实世界是实时的,延迟会让人很不爽(当然现实世界不一定是连续的,比如旧灯管是以60hz的频率闪动,但人眼发现不了)。对Agent来说这只是按照规则执行,没有情绪。但我会想起中学那台很卡的电脑,当时那种无力感还蛮气人的。
信息处理
讲到dbq这个命令行工具,很难想象有人类对每个指令每种组合都了如指掌(心理学上有个5±2的定律),即使是作者也很难完全记住吧。但对Agent来说这个信息量很轻松就能消化,而且对这类有规则的信息处理,正确性还满高的。现在写代码没有自动提示都写不动了,命令行就是这样——参数多,常用的不多,但没有语法提示和lint就老写错。
执行力
我自己会因为各种问题无形中阻碍自己前行。明明很想去做和学某样东西,却往往卡在第一步,不知道怎么开始。经历过几次尝试后,慢慢就学会了放弃,因为没有想清楚前往往不会去行动,很多事情会卡在非核心问题上。对Agent来说按照意图去做事情——自动上网搜索,分析材料,出方案,实现方案——都是毫无停顿的,不要管它是不是做得对。就在这一点上我自己就远远不如它。
Token消耗
还有"token"消耗的问题。如何让自己有限的每天"token"额度做更多事情?目前Agent token的消耗额度基本花钱就能增加,而自己每天能消化的信息受到心理和生理的影响,有时候脑子负载过高没法继续处理高信息密度的内容,有时候是眼睛太累了,没法继续看下去。
Mindset切换
mindset switch这件事也很有意思。Agent可以保存任意的mindset,毫无上下文切换开销。自己经历过两种切换:情绪切换,自己常常用Tabs自弹自唱,当很沉浸于一首歌的时候,突然抽离换到另一首歌后,大脑仿佛某部分结构被破坏了一样,体感极其不佳;工作任务切换,在深度处理一个工作内容中,突然被人打断,切换到另一个任务去。越是深度沉浸于一个任务,切换到另一个任务所消耗的能量越大。
多重宇宙
使用Agent后出现了"多重宇宙"的感觉。当自己只有一副身体的时候,在一个时间窗口中几乎只能一种选择(收敛到做工程项目),用Agent却会出现无数种(只要能有无限算力)。
两种使用情况
实践中我发现有两种情况:
未知领域——不知道问题的解决方案应该长什么样子。自己缺乏实现的信心,更多地让Agent自由发挥,但很多时候没有把想要的功能做出来。有时候会把自己的短视和局限体现在提示词上,同时传递给了Agent。
已知领域——知道解决方案的样子。自己会充满自信,同时也不担心Agent的执行结果,自己能选择到自己觉得合理的方案,需要有更多的想象空间。
发散和收敛,确定性与不确定性。