
没想到自己有一天会发这个帖子,再次提醒各位佬友拼车的时候一定要小心再小心,哪怕是站内的车也一样,现在中转站掺水可以说防不胜防,很多就是站内的佬友出去做的,可以说敌在暗我在明,连内置提示词和掩饰方法都开始与时俱进了。
故事是这样的:自己是在L站跳蚤市场拼的Claude MAX 20x 二人车,MAX 20x的车本来就不好找,而且还是二人车。看描述也挺实诚的,像是自用的,看了下他的个人主页,之前也稳定活跃,几个月前就开始自己当车头了,所以第一印象还是挺好的。
然后加上QQ后,不走咸鱼,其实已经初见端倪了,但包退款稳定的MAX20x的车这年头确实有价无市,更何况对面态度很好,允许先试用几天再看,而且还没付费就直接让我测试了,几个用例下来都是纯血的claude opus,速度和稳定性都达标。于是先打了2天的款,后面继续用了2天,都没任何问题,用量特别大的时候甚至能顶到claude max自己的5h墙,更加确信稳定下车了,因为希望长期合作,所以直接结了全款,开始爽用了。
时间回到今天,一大早起来用的时候就感觉明显的不对劲,吐字非常快,但是智力非常差,指令遵循烂到几乎没有,同一个问题前面犯了后面屡教不改,几乎无法正常完成项目,和过去的Opus大相径庭。开始怀疑是不是掺水了,于是测试了几个L站的标准用例:
几个都是典型的opus的特征,但模型是整体哪哪都不像Opus,不仅是语言风格,思维能力,指令遵循度,最奇怪的还是吐字速度,非常快,快到像是gemini flash模型。在测试过程中,还发现一个诡异的问题:
这个模型的答案是很符合opus 4.6的标准的,官渠满血就是这个调性,也没有乱码,问题在于,这个模型吐字的速度非常之快,甚至可以说压根就没有思考,最古怪的是,两次测试的结果是一模一样的,我可不记得我把temperature设成0过。抱着这个怀疑,我对其做了一下抓包。
好家伙,固定回复伪装AI生成是吧,合着检测到关键词就直接输出对应内容?连Thinking内容都没有,你流式的chunk都tm写一块儿去了,都造假到这个份上了,还不额外下点功夫吗?真当能买你MAX 20x二人车的是什么善茬吗?能被这种小把戏骗过去?
好歹让AI自由发挥一下,硬编码一段固定文字是生怕我看不出来吗?
基于这个发现,我对其他的AI检测手段也不抱期望了。引号可以通过正则全部改掉,回复可以检测模式匹配然后输出固定答案。回头来看,模型极差的智力,完全不符合Opus风格的表达和行为,快到不正常的吐字速度,都说明这是一起明显到发指的以次充好掺水行为,然而为了不被暴露,车主竟然在一些关键的测试用例上却动起了小脑筋,试图通过修改答案的方式瞒天过海,为人所不齿,也多亏我魔高一丈,不然还真被糊弄过去了。
也请各位佬友在拼车时注意再注意,一定要走平台,要么就问问能不能按天付费,目前甚至我只建议拼oauth的车,掺水的鬼点子也越来越多了,目前常见的检测方法在不久远的将来毫无疑问会被逐步攻克,这次是滥竽充数的模型实在是太烂,冒充方法也非常拙劣,下次用sonnet之类的的冒充,就不一定能看出来了,中转站和拼车最好也选择有口碑、有历史的,或者oauth这种做不了假的,不然指不定给你整出什么幺蛾子了。
介于最后车主还是把钱退了一部分(没要求全退,担心惹急了跑路了),就不撕破脸挂名字了,希望车主看到这个贴子自己好自为之,大家拼车的时候记得多留一点心眼,A\的封锁越来越严重,不要贪图便宜最后吃了大亏。
































