行业资讯你的位置:静澜设计有限公司 > 行业资讯 >

测完几个Agent器具,我发现他们能代打游戏了。。。

发布日期:2026-06-01 14:18    点击次数:66

测完几个Agent器具,我发现他们能代打游戏了。。。

发个提示,给点权限,AI就能我方大开游戏库库玩了。

不懂咋玩?那就截图识别。没法操作?奏凯现搓剧本。操作一坨?致使还能上网我方找攻略。

这即是当今跑在你电脑上的 AI Agent 能作念到的事儿。

Codex

世超把市面上的一些 Agent 器具测了一遍,比如Codex,TRAE,QoderWork,Workbuddy,Marvis等等。

只可说,这玩意儿吹了这样久,大伙儿可能真毋庸再不雅望了。

从左向右轮番为:第一滑WorkBuddy,TRAE,Marvis;第二行Codex,QoderWork,悟空

天然,一听 code 啥的,大伙儿可能以为是为专科确立者造的,门槛高,学起来用起来会很困难。

诶,莫牵挂,大厂们也都悄摸进化一轮了。

之前如实硬核了点,一个两个的都照搬 VS Code 那种传统的编程页面,稳当确立,但并不稳当和 AI 一齐确立。

VS Code页面

既然引入 Agent 了, 那确定得再行瞎想,毕竟它是来干活的,而东说念主是监督它的。

是以天下都很瓦解地改了兼并套交互逻辑,把具体的代码隐去,再把 Agent 干活儿时的日记露馅出来。

在网页里你可以叫它敦厚,但在 Agent 器具里,你得化身雇主,把活儿给分担显著。

Codex

咱先来看界面,也很爽脆,主要三个部分。

左边是你手底下掌管的名目,中间是成例的聊天窗口,右边就能看到恭候验收的东西了 ( 一般等责任运行了才会有动静 )。

向左滑动,轮番为:Codex,TRAE,WorkBuddy,Qoderwork

能 BB 就不动手,咱先去 Agent 器具的 “ 诈欺商店 ” 里逛逛,望望有啥合适的时刻包,也即是 Skill,给 Agent 装上左膀右臂。

能看到,五花八门啊,毕竟活儿的种类也就那么多,是以凡是知名有姓的基本都能扒拉到现成的有狡计。

什么数据分析,内容创作都不在话下,固然不至于个个都好用,但参考参考终归是能少走点弯路的。

Marvis

其中作念的相比有新意的是腾讯新出的 Marvis,把时刻商店作念成了近似小红书的信息流,可以边刷边储藏时刻。

再加上时刻在这些器具里是通用的,是以最近小红书我方也上线了 Skill 商店,用起来也颠倒浅易。

天然,就算挑不外来也不巨大,时刻商店里还有帮咱选时刻的时刻。

Codex 里叫 Skill Installer,WorkBuddy 里叫 Find Skills,算是将懒东说念主式进行到底。

左:Codex;右:WorkBuddy

至于我方造时刻倒是毋庸急,固然可以通过 AI 一步步相易造出来,但先射箭后画靶一般都不好使。

好的时刻常常是先我方跑通几遍,再索求总结,会更接地气,也更贴合我方的使用场景。

向左滑动,轮番为:WorkBuddy,TRAE

选好时刻就可以运行任务了,这里在运行前需要选一下任务类型,默许的是世俗款,亚洲国产精品成人一区二区三区但一般 Plan 阵势更好使。

这点还挺遑急的,因为许多期间扫尾不睬想不是 Agent 太笨了,而是咱我方也不知说念想要什么。

这个 Plan 即是在职务运行前先目标一下,明确任务的条条框框。

有什么失当就奏凯改了,毋庸比及终末才发现场合跑偏了。

Codex

浮浅说一下咱要作念什么,就能敲回车下发提示了。

为了看具体进程,咱挑 3 个运气儿来展示一下,OpenAI 的 Codex,字节的 TRAE 和 腾讯的 WorkBuddy,国表里的都拉出来溜溜。

任务就原地 TP,让它们仨锐评它们仨。

此时就能发现 Plan 的自制了,比如扩充当务前,Codex 和 TRAE 都向我二次阐述了下 WorkBuddy 具体是哪一个,因为海外有同名的诈欺,容易羞辱。

TRAE

天然,由于都是默许的模子,速率有快有慢,但就评释扫尾来看,如实各有 “ 特色 ” 呐。

WorkBuddy

先说 WorkBuddy,给到一个淳厚东说念主,上来也没问我评释是个啥面目,吭哧吭哧即是干。

终末给的网页,就后果来看,还是可以的,排版和内容固然 AI 滋味重了点,但花里胡梢的稳当咱锐评的主基调。

何况调研后的论断颠倒低调,把我方放在了靠后的位置,喷起我方绝不手软,实诚这一块儿到位了。

TRAE

再来看 TRAE ,给到一个东说念主上东说念主,活儿干的相比密致,我的漂亮老师2中文字幕版不管是前期的弹出式的表单目标,还是中间的调研,念念路都很明晰,子 Agent 的调用亦然颠倒闇练了。

中枢论断里,固然把我方排到了大哥,但考量了 6 个维度,总分是加权出来的,也算是有理有据了。

Codex

终末的 Codex,基本即是咫尺这个限制的标杆了,评释里先来一手信源分析,就跟大伙儿拉开了点距离,底下的评价也能彰着嗅觉到更潜入一些,辘集了官方居品文档的内容。

模子好如实有上风,但有计划到国内用起来不浅易,暂且给到一个半夯吧。

接下来,任务持续,让他们把各自的评释生成一份可视化的落地页。

你可能会说这活儿在网页里也能作念,何况还更快。

Gemini

倒也没错,但不同的点在于,这里你不需要把代码再复制粘贴到腹地了,何况最遑急的,Agent 会我方调用器具,去查抄制品有莫得 BUG。

比如相似的任务,交给网页的 Gemini,这家伙甩给我几百行代码,我粘到腹地大开,发现一派空缺。。。

而这些 Agent 会在委用之前就幸免这种情况。

WorkBuddy

WorkBuddy 是我方调用了 3 次预览,作念了 2 次优化,才把网页交给我。

TRAE

TRAE 奏凯一些,奏凯大开了内置的浏览器,通过不同角度的截图识别,打不开就刷新重试,直到阐述渲染后果稳当预期。

Codex 也一样, 权限不够,老是截不着网页,试了 N 次才阐述好后果。

是以落地页的后果倒是其次,重心是这套任务扩充的逻辑,是跟网页端应答交差都备不同的嘱托。

特出是截图反映的器具调用,颠倒于给电脑安了个赛博义眼。

而像 Codex 这种更进一步,有 Computer Use 功能,可以全局截图反映,然后操作。颠倒于你电脑上的软件,它都能大开,等模子智力更猛了,代打几局 LOL 也不是不行能。

Codex

天然,除了时刻 skill,这些 Agent 器具还能接入其他诈欺,像是 GitHub,邮箱,网盘等。

更妙的是接入一些通信软件,像微信,飞书,这亦然龙虾当初火起来的一大原因。

接入后就能双向邻接,甭管是从 Agent 往飞书发文档,还是从微信高唱 Agent 往工位高下载资料,都没问题。

WorkBuddy

像是之前长途软件的升级版,加了个 Agent 当管家,帮你 24 小时盯着我方的电脑,随叫随到。

好像有一些定时的任务,也能找到 “ 自动化 ” 这种类型的进口,让它遴选每天没趣重迭的进程性任务。

向左滑动,轮番为:Codex,TRAE,WorkBuddy,Marvis

说了这样多,其实不管是什么时刻,装什么插件,本体上都是在经管,杀青着 Agent 朝咱预定的场合产出东西。

有大佬悉心优化的责任流,有厂商调教好的操心系统,也有浅易实用的时刻包。

用专科点的话说这些都是 “ Harness ”,开心是给马套上马具,放这儿也黑白常贴切了。

不管马具底下的模子是哪一匹,这些 Agent 器具都得随套随用。

就用起来的体感而言,Codex 是相比夯的,模子过劲,额度还偶尔重制,固然需要小数时刻,但比起 Claude 要浮浅得多,稳当想体验顶尖性能的折腾党。

如若不想困难,奏凯用国内大厂的有狡计也行,嫌默许的模子笨,就去买点 DeepSeek 的 API 接上,亦然妥妥的性价比平替。

至于平替内部选哪一个就取决于你的使用场景了,微信和 WorkBuddy 结伴浅易,飞书和 TRAE 集成更深,钉钉那儿即是 Qoder 以及咱没测到的悟空了,不外逻辑都是一样的。

但话说转头,Agent 器具亦然有流毒的,即是上的时刻越多,耗尽的模子 Token 也越多,动不动几十分钟的长线任务,账单会变得贼拉长。

是以有什么低廉管饱的模子套餐,大伙儿就输攻墨守吧。。。

而如若不太繁琐的活儿,这些 Agent 器具也有免费的额度,白嫖一下尝尝咸淡老是不亏的。

撰文:风华

裁剪:江江 & 面线

好意思编:焕妍

图片、资料开首:

Codex, TRAE, WorkBuddy, Marvis,QoderWork,悟空



Powered by 静澜设计有限公司 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2015-2026