okooo澳客APP官方网站

okooo澳客 夯爆了!GLM

okooo澳客 夯爆了!GLM

大家好,我是小林。

前几天 GLM-5.1 刚发布,有极少惊喜的是 GLM Coding Plan 全部用户齐不错用 GLM-5.1 最新模子。

我第一时刻就去尝了鲜,章程发现:此次新模子如实有点东西!

那时我还疏淡发了条一又友圈,齰舌用它给「」网站修 bug、顺带加多双语和多字体切换功能,体验极其丝滑。绝顶是它的 Plan 模式,先筹算后实施,竟然一把过,完全不需要返工,险些优秀。

张开剩余95%

一又友圈一发,下面炸出不少一又友留言:“这模子到底强在哪?”、“跟之前的版块有啥实质别离?”

我那时也没张开说,就回了句「在长程任务上的推崇如实靠谱」。

但过后我我方越琢磨越心痒:修几个小 bug、加个小功能酌定算缩手缩脚,如果径直扔给它一个实在的复杂面目,它还能不行重新到尾稳稳扛下来?

说干就干!这几天,我径直拉着 GLM-5.1 搞了一波深度实测,硬生生从 0 到 1 手搓了一个「自动化小红书内容运营 Agent」。额,不合,不行叫手搓,应该说是口喷出来的。

浮浅来说,这即是个「爆款制造机」:自动去小红书持取爆款案牍,用 AI 深度改写,接着自动生成配图,终末以致能一键发布。

接下来,我会跟大家共享一下,我是如何用 GLM-5.1 一步一步「口喷」出来「自动化小红书内容运营 Agent」的。

不外,在厚爱拆解面目代码之前,咱们得先搞懂一个中枢意见,到底什么是「长程任务」?

清醒了它,你就会瓦解,为什么这一次的 GLM-5.1 让我以为它和已往的模子果真不相通。

什么是 Long Horizon 长程任务?

AI 编程这条路,其实走过了几个很知道的阶段。

最早AI只可当个提效小助手,帮你补补代码、查查文档。自后流行起了 vibe coding,你有个主见跟AI聊聊,它就能帮你搓出一个家具原型来。

再自后到了 Agentic 编程期间,大家运转让AI自主筹算、我方写代码、我方调试。

但实在在一线写过代码的伯仲齐知谈,真实全国里有价值的业务,整个不是靠一句辅导词或者调两次接口就能责罚的。

你让AI帮你写个函数、改个 bug,几分钟就责罚,这叫短任务,大部分模子齐颖慧。

但你让AI帮你从零搭一个完整的面目呢?要筹算架构、写代码、调试、作念前端、联调接口,中间可能还要调用好几个外部器具,遭遇报错还得我方排查。

这种跨许多措施、需要万古刻保持筹办不跑偏的活儿,就叫 Long Horizon 长程任务。

METR 的连络也印证了这个趋势,AI 能责罚的任务复杂度正在指数级增长,差未几每 4 到 6 个月就翻一倍。也即是说,长程任务才智正在成为考试模子到底聪不聪惠的新模范,单轮问答仍是不够看了。

这种任务对AI的条款绝顶高。它不光要会写代码,还得像一个资深工程师相通,把复杂筹办拆解成可实施的措施,记取前边作念了什么,后头还要作念什么,半途遭遇随机还得随声传颂。

说真话,目下大部分模子在这块还差点意念念。许多模子写个几百行代码就运转「忘事」了,迤逦文一长就丢舛误信息,或者干着干着就偏离了最初的筹办。

而 GLM-5.1 即是智谱专门针对这个痛点推出的,定位是面向长程任务的开源第一模子,在 Artificial Analysis、SWE-Bench 这些中枢榜单上齐拿了开源第一。

引诱自动化小红书运营 Agent

刚好我有个痛点,我要常常宥恕最新的AI资讯和AI器具,小红书即是我的重要信息源之一。

然则你知谈的,每天刷高赞帖子、手动总结、手动配图、手动发布,这一套过程下来,我干了一阵子实在受不显然。

我就想,能不行搞个自动化的东西,帮我把这些类似服务全干了?

但这个需求你仔细想想,其实还挺复杂的。从持取内容到最终发布,中间要经过这样多措施:

手写的话如何也得一两周。

那我此次就打算用 GLM-5.1 从零作念这个面目,望望它能不行扛住这种真实全国的复杂需求。

第一步:让它筹算架构

我把需求丢给它之后,它先给我输出了一份完整的架构决议,把通盘数据流重新到尾梳理了一遍。

说真话,这个筹算的良好程度超出了我的预期,我有一种这不像是AI写的,像是一个干过两三年的后端给我出的决议的嗅觉。

它把通盘系统拆成了好几个阶段,从数据如何流转、模块如何单干、哪些场合需要作念容错,齐料到了。

我举两个让我印象比拟深的点。

图片生成的左迁机制:我的需求文档里就写了一句"自动生成封面和内页",很浮浅对吧?但它我方给我遐想了五种生图决议,还作念了一套自动选拔和左迁机制。

啥叫左迁机制?即是说如果首选的生图服务挂了,它会自动切到备选决议。备选也挂了?那就径直从原帖持图来用。总之即是保证系统不会因为某个关节出问题就通盘卡住。

这个容错逻辑我一个字没提,完全是它我方加的。坚信常常vibe coding的一又友齐会知谈极少:大部分模子你不说它就不作念,就那种很较着的需要脱手的场合,他齐不搞,总想提前收工,然则GLM-5.1 会主动补位。

内容改写的兜底决议:它琢磨到了AI改写接口可能会调用失败的情况,我方作念了一套模板兜底。就算AI改写炸了,系统也不会停,会用预设的划定拼出一版能用的草稿,链接往下走。

这些工程上很推行的问题,我一个字没提,它齐料到了。

你品品,这可不是浮浅的你问我答了。它是果真在像一个有西席的工程师相通念念考,那处可能出问题,出了问题如何兜底。

第二步:运转写代码,遭遇问题我方修

架构筹算完就运滚动工了。

引诱过程中遭遇了不少问题,但有利念念的是,大部分问题它我方就解决了。

比如有一次数据库在同期写入的时候偶尔会锁住。啥意念念呢?就好比两个东谈主同期往一个簿子上写字,手打架了。它发现这个问题后,我方转念了数据库的并发建立就责罚了,齐没让我费神。

换成已往用别的模子,这种运行时才裸露的问题,八成率要我我方 debug 半天再手动告诉它如何改。此次是它我方发现、我方定位、我方修。

还有一次改写接口复返的数据样式不太强壮,有时候是模范的 JSON 样式,有时候又是污七八糟的。它作念了好几层默契兜底,先试模范样式默契,不行就换别的时势索取,保证不论接口复返什么奇怪的东西齐能处理。

代码写完后,它还给我作念了一个照拂看板,四个页面:数据总览、逐日持取新闻、图文与发布、运行记载。

在看板上能看到每天持了若干内容、生成了若干草稿、发了若干篇、哪些失败了。还能径直办动触发一次全过程,或者从新发布某篇失败的内容。

第三步:联调踩坑,okoooappGLM-5.1 帮我排雷

到这一步,代码主体仍是写完结。

但因为这个面目触及到生图服务和小红书登录,需要我我方填 API Key 和扫码登录,这些明锐操作 GLM-5.1 没法帮我作念,我得我方上手跑全过程。

然后,坑就来了。

第一个坑:小红书搜索接口复返空数据。

第一个坑:小红书搜索接口复返空数据。

我用了一个小红书的 MCP 服务。MCP 你不错清醒为一种让AI调用外部器具的模范条约,通过它AI就能去搜索小红书上的内容。

但不论我如何调,搜索接口即是复返空数据,啥也搜不到。

我那时一脸懵。MCP 服务仍是正常启动了,小红书也登录了,我以为是代码写错了,在那死磕苦求参数,多样 debug。

自后实在没辙,我把问题丢给了 GLM-5.1。

它莫得像我相通在代码层面死磕,而是径直往上游想,定位到了是建立层面的问题。按照它说的时势建立好之后重启服务,数据哗哗地就搜索回顾了。

这个问题其实不难,但我我方八成率还要在代码里转半天。GLM-5.1 比我清醒,径直料到了最上游的可能性。

第二个坑:生图服务认证时势不合。

第二个坑:生图服务认证时势不合。

改写模块要主办到的高赞内容聚类成主题,然后针对每个主题生成小红书立场的标题、正文、标签和配图辅导词。到生成配图这一步,我用的是即梦的生图服务。

这个服务的认证时势比拟特殊,跟普通的 API 不相通。GLM-5.1 第一次写的时候搞错了,苦求径直复返 401。

这里诠释一下,401 即是"你莫得权限"的意念念,平常是因为身份考据没通过。

但它看了报错信息之后,我方分析出是认证时势用错了,然后重写了认证过程。两轮对话就解决了,我齐没如何投入

通盘坑齐趟过之后,来望望完整的成果。这是总体的概览

起头咱们需重点击实施任务,运转上图通盘活水线过程的实施

咱们不错看到,前端页面和服务日记里齐会展示,目下正在运转去小红书持取札记

每一步齐有进程上报,景色及时炫耀在看板上。

持取到内容后,会主办取内容的标题展示在运行日记上,之后会进行AI识别,识别这些持取的内容是否咱们所需要的AI器具、AI资讯的东西

然后筛选出题材后,就运转热度评分,然后把热度靠前的,进行总结改写

终末运转配图,然青年景草稿,供咱们选拔

咱们在图文与发布这个板块,就能看到咱们通盘实施时,最终完成的物料

同期还会把每次持取到的原始素材,放在逐日新闻照拂这里,匡助溯源

然后还有个数据大盘,帮我进行数据分析

还不错看札记确定,内部是咱们改写后的内容

之后咱们就不错去发布了

发布见效后,图文札记的景色也会造成published

我大开我的小红书后台,明确是发布了札记

真实感受

其实完整跑通此次的面目后,看着屏幕上跑起来的代码,我心里挺叹气的。

我是果真一齐看着 GLM 这样「打怪升级」过来的。纪念我第一次实测它,那如故 25 年 7 月份。那时的 ,才智仍是弥散搞点翔实其事的网页 Demo 了,我还拿它复刻过一个 B 站的主页。

到了 25 年 11 月,升级成了 。这时候它仍是不是只可跑跑 Demo 的阶段了,我运转敢把它拉进推行的业务面目里,让它赞理排查和诞生 Bug,如实能摊派不少活儿。

接着,这迭代速率就运转狂飙。只是一个月后的 12 月, 出炉。那次我径直上了个强度,让它从 0 到 1 复刻了一个微信,况兼是前后端全部责罚,那时就以为相当赞。

再自后,即是本年 2 月份迎来的王炸级更新:。到了这代,它的才智仍是极其接近那时的顶流 Claude Opus 了。我径直丢给它一个系统级的硬核面目「GO 微服务网关」,内部多样顽恶的时刻难点,它竟然全我方啃下来了。

一直到目下的 GLM-5.1,长程任务的才智又迎来了一波肉眼可见的跃升。

一直到目下的 GLM-5.1,长程任务的才智又迎来了一波肉眼可见的跃升。

这每一次的起头,名义上看只是版块号加了零点几,但在我这个引诱者的眼里,是一次次高大的质变,它正在一步一步,从一个「偶尔惊艳的玩物」,造成了一个实在能替你扛起复杂工程的「赛博结伴东谈主」。

这种看着国产大模子在自家眼皮子下面赶快进化的嗅觉,果真挺让东谈主高亢强烈的。

是以,回到此次用 GLM-5.1 搞完这个小红书 Agent,我最大的感受就两个字:释怀。

已往用 AI 写代码,总有一种「老父亲盯孩子写功课」的心焦感,恨不得每隔五分钟就去抽查一下,惟恐一跑神它就跑偏了。

但此次用 GLM-5.1,你完全不错死亡让它我方往下跑。

你只需要璷黫甩给它一份和爽直的需求,它竟然能我方在那琢磨:“这块可能会出幺蛾子、那块得作念个容错、全体架构得如何拆”。说真话,这作念 Plan 的脑子,比我预期的灵光太多了。

况兼它的「膂力」是果真顶,持续输出有用内容的才智极强。从底层的架构遐想、具体敲代码,到狂放修 Bug,再到终末的前后端联调,这条超长的链路它硬是我方一个东谈主全扛下来了。

中间遭遇报错,它还会我方看 Log 我方改。除了那种真需要我填 API Key 或者扫码授权的死角它如实没招,其他基本没让我操什么心。

诚然了,它也不是毫络续隙。比如有些代码写得如故偏啰嗦了极少,前端为了省事也没上主流框架,搞得以后我想加点新功能可能会比拟良友。

但有一说一,完满无缺,这从 0 到 1 的完成度仍是极端硬核了。

最让我细念念极恐的极少是:大家别忘了,此次 5.1 距离 GLM-5 发布,满打满算也就隔了一个多月啊!只是一个多月又能进化成这样,这速率险些离谱。

我个东谈主在实测的时候,就嗅觉它的手感仍是直逼目下的天花板 Claude Opus 4.6 了。

自后我还疏淡去查了下各大榜单的跑分,好家伙,距离 Opus 4.6 竟然只消 2.6 分的幽微差距,怪不得用起来的体感仍是极其接近了。

是以总结一句:如果你最近也在琢磨拿 AI 搞点有复杂度的引诱面目,我强烈提议你亲私用 GLM-5.1 去试一把。

尤其是那种需求明确、业务链路知道的工程类面目okooo澳客,坚信我,它的推崇整个会比你预期的还要好得多。

发布于:广东省澳洲幸运8官方网站入口

okooo澳客APP官方网站