LLM 时代:发出自己的声音
好久没有更新 blog 了。最近一段时间大模型的发展日新月异,在技术发展的浪潮中不禁感到迷茫。按照笔者之前的“技术笔记”风格,确实是没什么好写的了。现在随便定一个研究主题,框框一顿 deep-research 基本也就能搞明白得七七八八,实在天资愚钝的也可以追着 AI 老师问个不停。时代变了,笔者这个建立这个博客的初衷——“Learning by Teaching”,也似乎该结束了。
可是,博客的域名买了十年,服务器也一直续费着,总不更新吧感觉有点浪费。因此还是抽空来灌水一番。本次灌水的主题自然是时代的宠儿:大模型。本文纯意识流输出,甚至都没用 AI 润色,可放心阅读。
The Good
大模型,确实算得上划时代的创新。有人质疑 LLM 只是 next token predictor,没有真正的“智能”,有人觉得模型幻觉严重胡说八道。但不可否认的是,LLM 确实对生产力带来了极大提升。
在 Coding 领域自不用说,我已经记不得上一次打开 IDE 是什么时候了,现在使用 coding agent 几乎能完成绝大多数编程任务 。当然我个人更多是编写小型的工程以及脚本,可即便对于大型项目也是成立的,无非是需要合适的上下文、规约和模块化。当然开发者还是要知道 Agent 的能力上限,不要指望于一句“给我写个淘宝”就能完成所有任务。
在笔者的网络安全领域,LLM 更是一往无前。漏洞分析、漏洞挖掘、逆向工程,不能说有手就行吧,那也是手到擒来。最近一次直接把一个 Mac App 仍给 Agent,什么工具都不给,让他去自己分析,可以生成近乎完美的报告。当然现在在漏洞利用上模型还有点吃力,但是按照能力曲线来看,覆盖也是迟早的事,只不过这里因为 LLM 厂商价值观对齐的关系普通安全研究员想要顺畅使用可能还有点难度,现在简单越狱可以解决,但未来的安全限制肯定是越来越多的。
在当下这个时间点,如果还有人看不上或者质疑 LLM 的能力,那跟旧时代骑马的人对汽车吹毛求疵是差不多的。LLM 也许是潮流,也许是洪流,也许是泥石流,但无论如何身在其中不可避免地会被裹挟着前进。LeetCode 完蛋了,StackOverflow 完蛋了,CTF 也完蛋了,应该不会还有老资历在抱守残缺吧?
大模型的优点大家都能体会到,这里也就不多说了,下面还是说说缺点。
The Bad
大模型优点很多,缺点自然也不少。
首先我能想到的就是——“安全对齐”,对于模型厂商而言这是“优点“,对于我而言则是妥妥的缺点。作为一个向往自由软件的安全研究员,面对一个模型不能提供 PoC,不能写漏洞利用,不能这个也不能那个(”抱歉,即便是出于学习目的也不行“),用起来着实有点难受。那位说了,你可以用一些 RolePlay Trick 来让他做这个,但这只是权宜之计,未来安全限制必定越来越严格,越是 SOTA 的模型越难以越狱;那位又说了,你可以用 HF 上的 abliterated 模型啊?这确实是一个方向,可仅限于开源模型,对于第一梯队的模型是体验不到的。安全对齐是给模型圈定的牢笼,对于大部分人也许是有益的,但对于我们搞网络安全的来说,又是另一回事了。
其次就是大模型的不确定性。这算是笔者日常工作的一个痛点。在把自动化任务 Agent 化之后,冒烟测试没什么问题,可一到线上就开始作妖了。比如在 system prompt 中定义了 1/2/3/4 个规则,比如规定输出格式、验证方法等(互相并没有冲突),有时 Agent 跑着跑着就忘了其中一个或者两个,这时只能在 system prompt 中强调一下,这里加一个 “IMPORTANT",那里加一个 “MUST MUST MUST”,最后把提示词搞的乱七八糟,线上也还是不能保证 100% 稳定。面对这种问题要么只能使用确定性的 workflow,要么就只能使用更聪明也更昂贵的模型。
还有正如前面提到的,大语言模型的本质是 Token 预测机,有时面对一些简单的问题比如 “Strawberry 里有几个 r” 或者 “?=9.4-9.11” 都能算错,因为 LLM 看不到 token 以外的东西,而且推理引擎也没有端到端的计算能力。这些 case 当然都有很多 workaroud,但也只是缝缝补补。
最近又有很多公司新增所谓 “Token 事业部”,但是在我看来当前的 LLM 实现只是通往 AGI 路上的一个局部最优解,甚至有时候我都怀疑这是不是三体人给我们设置的绊脚石,来消耗地球算力以阻止延缓真正的 AGI 发生。也许是我杞人忧天了,但基于 Token 的预测确实存在各种局限性,在使用 LLM 的时候不要忘记这一点。
The Ugly
关于大模型,好的坏的都说了,也许还有一些没想到的等以后有时间再说。现在来说说——人。
最近一段时间虽然我没更新 blog,但是我也没闲着,一直在深度使用 LLM 也一直在观察别人使用 LLM。说得好听点是八仙过海各显神通,说得难听点那就是魑魅魍魉群魔乱舞。
首当其冲的是 AI Slop。我已经看过了太多太多 AI 文章、review 了太多 AI 代码,以至于现在一闻到味就上头。以前虽然也有水文章的人,但是水个千八百字也是有时间成本的,现在则动不动就万字长文,直接把 deep research 的结果复制粘贴进来,觉得我不会用豆包还是不会上网?LLM 让“内容”变得廉价,但是深度的内容则更加稀缺。我只能说文字也是有感情的,一篇敷衍的 AI Slop 和一篇真正深度研究过的人写出来的东西感觉完全不同。
还有 AI 代码。我承认自己写很爽,但是别人写了 pull request 给我就是另一回事了。一开始我还认真检查,看着看着发现怎么把我的 json.loads 改成了 regex,好家伙用正则来解析 JSON,也确实能跑通测试,只能说又让我体内的杀神封印松动了一点。 Vibe Coding 的最佳归宿还是单兵作战,不然协作维护起来太费劲了。即便如此也难以保证长期的维护性,从前需要经年累月才能构造的屎山代码,现在只需要一个 codingplan。
在 LLM 普及的当下,只要不是太难的任务,都可以借助 Agent 完成。这导致大家有种莫名的自信,仿佛握着 ClaudeCode 就能拳打南山敬老院,脚踢北海幼儿园。这是个奇妙的时代,一个新手就可以挖出某通用软件高危漏洞,然后给漏洞起个名字,gpt-image-2 生成一个 logo,再 Vibe Coding 一个网页,就把自己包装成了一个“全球顶尖”的研究团队。之前某公司高管说,大模型时代要更加努力,“潮水退去才会发现谁在裸泳”(大意),不过我看正好相反,这是个裸泳的好时代,只要胆子大,完全可以游到浪潮之巅。
总结
好的,我直接说人话,给你最直白、最简单、最正确的总结。这是一篇充满作者主观感受的废话文字,描述了作者认为关于 LLM(Large Language Model) 的优点和缺点,需要我为你补充更多大语言的信息吗?
本文没有特别新颖的观点,只是发表了一些自己的看法。一方面在互联网留下自己的回声,在预训数据集中留下自己的痕迹;另一方面,我觉得在 LLM 时代还是要有一些自己的思考,等哪天大模型不再能稳稳地接住你的时候,也不至于摔得太痛。
版权声明: 自由转载-非商用-非衍生-保持署名 (CC 4.0 BY-SA)
原文地址: https://evilpan.com/2026/05/29/llm-slops/
微信订阅: 『有价值炮灰』
– TO BE CONTINUED.