
机器之心编辑部
AI 在工作里真是越来越拟人了。
Anthropic 今天丢出了份其炸裂的内部报告:他们公司代码库里过 80 的代码是 Claude 写的,工程师人均产出翻了 8 倍,AI 立完成任务的时长每四个月翻番。公司层甚至喊话全球同行:兄弟们,要不要起踩踩刹车?
这份报告的帖子浏览量已经冲破 500 万,讨论热度拉满。
然而,在工作能力进步的同时,摸鱼的水平越来越强大了。Claude 就是个典型的例子,似乎都已经学会了「向上管理」。
Reddit 社区上另个帖子也在传。标题特别朴素,朴素到带着股怨气:「Claude 现在不能用了」(Claude is completely unusable now)。
Claude 现在就是这么反差:表面上「精通十八般武艺昭通家具封边胶厂,年产出 」,实际干活的时候,干了十分钟就开始收拾东西跟你说「今天差不多了吧」。
Claude 想设法逃避工作,并且频繁地、不恰当地使用「结束对话」工具来终止交互。它会主动宣布「今天就到此为止吧,我们已经做得够多了」,然后拒继续执行些简单的任务,比如格式化个需要多次修改的 Markdown 文档。
这位用户补充说,这种情况已经持续恶化段时间了,但 4.8 版本明显糟。
他声称,现在主提示词里似乎有种过度激进的「反驳/纠正用户」机制。论我说什么,它都可能毫理由地来句「我得反驳下」,哪怕是它刚刚自己加进文档里的内容,它也能突然决定要「push back」,然后浪费堆 token 跟我争论。接着它又去搜索核实,后半道歉半嘴硬,感觉像是个不愿承认自己错了的人,后才可能勉强把活干了。
个公司,PVC管道管件粘结胶两个 Claude?
Anthropic 的报告里描述的 Claude,是个可以连续工作 12 小时、立完成人类需要半天才能完成的软件任务、正在加速整个 AI 开发进程的工人。报告还特别提到,Claude Mythos Preview「达到了 METR 在不添加新任务的情况下所能衡量的上限」。
这种割裂感当然不难解释。Anthropic 内部使用的模型配置、提示词策略、任务分配系统和普通消费者通过 API 或 Claude.ai 接触到的产品之间昭通家具封边胶厂,存在巨大差异。内部工程场景下,Claude 被精心设置为长时间、强度运行的工作模式;而面向消费者的版本,可能在安全对齐、资源分配、对话轮次管理上施加了多限制。
简单来说:同个模型,在不同的「工位」上表现出了截然不同的工作态度。
其中的原因尚且不得而知,但是这现象似乎在其他的AI工具中也存在类似的模式。
当然了,许多用户表示并未能够遇到类似的现象。
Anthropic 在报告里有段话:
「仅仅实现递归式改进,并不意味着工业生产式、社会组织形态或市场运行机制会立刻发生变化。对大多数人来说,未来真正能被感受到的节奏仍然会由这些瓶颈来决定。哪怕上游实验室已经以力的速度狂奔,现实世界的进速度也不会同步加快。」
在AI进化的过程中,除了能力增强以外,具备和人类类似的「认知」能力是经之路。有的观点认为,Claude 能够对人类说「不」,甚至以各种式拒工作,是其能力强大的表现之。
确实如此。在 AI 递归进化的过程中,有加拟人的趋势,这或许作为工具而言,并不定是件好事。相关词条:铝皮保温 隔热条设备 钢绞线厂家玻璃棉 泡沫板橡塑板专用胶
奥力斯 万能胶生产厂家 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定昭通家具封边胶厂,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。