拼车/中转站开始针对L站的检验方案掺水了

搞七捻三 人工智能 Claude 拼车
查看原帖
Sumimi
Sumimi 楼主
#1

:sweat_smile:没想到自己有一天会发这个帖子,再次提醒各位佬友拼车的时候一定要小心再小心,哪怕是站内的车也一样,现在中转站掺水可以说防不胜防,很多就是站内的佬友出去做的,可以说敌在暗我在明,连内置提示词和掩饰方法都开始与时俱进了。

故事是这样的:自己是在L站跳蚤市场拼的Claude MAX 20x 二人车,MAX 20x的车本来就不好找,而且还是二人车。看描述也挺实诚的,像是自用的,看了下他的个人主页,之前也稳定活跃,几个月前就开始自己当车头了,所以第一印象还是挺好的。

然后加上QQ后,不走咸鱼,其实已经初见端倪了,但包退款稳定的MAX20x的车这年头确实有价无市,更何况对面态度很好,允许先试用几天再看,而且还没付费就直接让我测试了,几个用例下来都是纯血的claude opus,速度和稳定性都达标。于是先打了2天的款,后面继续用了2天,都没任何问题,用量特别大的时候甚至能顶到claude max自己的5h墙,更加确信稳定下车了,因为希望长期合作,所以直接结了全款,开始爽用了。

时间回到今天,一大早起来用的时候就感觉明显的不对劲,吐字非常快,但是智力非常差,指令遵循烂到几乎没有,同一个问题前面犯了后面屡教不改,几乎无法正常完成项目,和过去的Opus大相径庭。开始怀疑是不是掺水了,于是测试了几个L站的标准用例:



几个都是典型的opus的特征,但模型是整体哪哪都不像Opus,不仅是语言风格,思维能力,指令遵循度,最奇怪的还是吐字速度,非常快,快到像是gemini flash模型。在测试过程中,还发现一个诡异的问题:

这个模型的答案是很符合opus 4.6的标准的,官渠满血就是这个调性,也没有乱码,问题在于,这个模型吐字的速度非常之快,甚至可以说压根就没有思考,最古怪的是,两次测试的结果是一模一样的,我可不记得我把temperature设成0过。抱着这个怀疑,我对其做了一下抓包。

好家伙,固定回复伪装AI生成是吧,合着检测到关键词就直接输出对应内容?连Thinking内容都没有,你流式的chunk都tm写一块儿去了,都造假到这个份上了,还不额外下点功夫吗?真当能买你MAX 20x二人车的是什么善茬吗?能被这种小把戏骗过去? :sweat_smile: 好歹让AI自由发挥一下,硬编码一段固定文字是生怕我看不出来吗?

基于这个发现,我对其他的AI检测手段也不抱期望了。引号可以通过正则全部改掉,回复可以检测模式匹配然后输出固定答案。回头来看,模型极差的智力,完全不符合Opus风格的表达和行为,快到不正常的吐字速度,都说明这是一起明显到发指的以次充好掺水行为,然而为了不被暴露,车主竟然在一些关键的测试用例上却动起了小脑筋,试图通过修改答案的方式瞒天过海,为人所不齿,也多亏我魔高一丈,不然还真被糊弄过去了。

也请各位佬友在拼车时注意再注意,一定要走平台,要么就问问能不能按天付费,目前甚至我只建议拼oauth的车,掺水的鬼点子也越来越多了,目前常见的检测方法在不久远的将来毫无疑问会被逐步攻克,这次是滥竽充数的模型实在是太烂,冒充方法也非常拙劣,下次用sonnet之类的的冒充,就不一定能看出来了,中转站和拼车最好也选择有口碑、有历史的,或者oauth这种做不了假的,不然指不定给你整出什么幺蛾子了。

介于最后车主还是把钱退了一部分(没要求全退,担心惹急了跑路了),就不撕破脸挂名字了,希望车主看到这个贴子自己好自为之,大家拼车的时候记得多留一点心眼,A\的封锁越来越严重,不要贪图便宜最后吃了大亏。

TOPIC OWNER
61 楼层
60 回复
40 用户
Sumimi neo phoenixs Forza_Milan
ading
#2

离谱。。整的和模型掺水了测试集一个路子 :smiling_face_with_tear:

phoenixs
phoenixs
#4

人才啊,不过也是公开测试集必然会面对的问题了

Forza_Milan
Forza_Milan
#6

这都掺假,有点离谱

haly
haly
#7

佬友把他艾特出来,我们避雷吧

PS:比较好奇,他最后是否承认掺水了

1个回复
Sumimi
Sumimi 楼主

没直接爆针对检验优化的问题,毕竟还有近1000块在他手上,只是指出了有掺水,对面也没反驳,估计是默认了

TOPIC OWNER
↓ 跳到帖子
XmOfficial
XmOfficial
#10

现在opus4.6对日本小说的回答好像也不一定出现美咲或者乱码了,我最近试的oauth是这样

1个回复
sanyuedev
sanyuedev

any router opus 还是会乱码

↓ 跳到帖子
normandy
normandy
#11

钱都退了还不挂,这怎么避雷???

ysjzy
ysjzy
#13

直接挂出来。其实我发现跳蚤市场最近水很深,还是顺明白的好

XmOfficial
XmOfficial
#15

支持发出来避雷,这种行为主观恶意太明显了

Sumimi
Sumimi 楼主 ↶ @neo
#16
3个回复
neo
neo

他还在持续大量接人上车,已直接封禁。

Forza_Milan
Forza_Milan

他这种一年多的号才七百多点数

1922524013
1922524013

我靠,差点上车了

↓ 跳到帖子
TOPIC OWNER
Keyi66
#20

只能看解决问题的能力,来判断是不是opus了

aka2
aka2
#21

拼车也有做假的……但是自己去买 Claude Max 太难了

#28

:rofl:
别这样,我还没你的一半,比你早4个月注册

1个回复
Forza_Milan
Forza_Milan

不是啊,就是拼车,一般都得找比较活跃的吧,虽然也不保真,比如最近方木就没上线了

↓ 跳到帖子
Sumimi
Sumimi 楼主 ↶ @haly
#29

没直接爆针对检验优化的问题,毕竟还有近1000块在他手上,只是指出了有掺水,对面也没反驳,估计是默认了

1个回复
osozos

惨,neo已经升级他为封号斗罗了,你1000不是寄了。
赶紧把帖子升到1级,防止被他看到,后续不退款了

↓ 跳到帖子
TOPIC OWNER
Forza_Milan
Forza_Milan ↶ @osozos
#30

不是啊,就是拼车,一般都得找比较活跃的吧,虽然也不保真,比如最近方木就没上线了

1个回复
user2902
user2902

方木佬的team车真的是稳的一批,从来没封过,现在team涨价了,不知道他还做不做这个,他好像比较忙,team车都是闲的时候会开

↓ 跳到帖子
#32

惨,neo已经升级他为封号斗罗了,你1000不是寄了。
赶紧把帖子升到1级,防止被他看到,后续不退款了

2个回复
Sumimi
Sumimi 楼主

拿回700才开爆的 :sob:不给退全款,但更担心直接跑路了,速战速决了

TOPIC OWNER
bbb
bbb

最后活动
9 分钟

已经看到帖子了

↓ 跳到帖子
Sumimi
Sumimi 楼主 ↶ @osozos
#34

拿回700才开爆的 :sob:不给退全款,但更担心直接跑路了,速战速决了

2个回复
haly
haly

这个拼车这么贵吗?竟然要1000,没有拼过,纯好奇

osozos

不对啊,原价才200,也就 1400,你怎么1000的?无限量吗

↓ 跳到帖子
TOPIC OWNER
sulfite5307 ↶ @Sumimi
#37

好家伙,打完款了就掺水是吧

#39

不对啊,原价才200,也就 1400,你怎么1000的?无限量吗

1个回复
Sumimi
Sumimi 楼主

他用的是早期的方案,车主自建家宽VPS然后分发api,之前市场价差不多就是900块左右……这种掺水概率确实太高了

TOPIC OWNER
↓ 跳到帖子
Akda_Thorns
Akda_Thorns
#41

拼车、中转站,现在纯卖方市场,而且几乎没有监管,普通用户就跟砧板上的鱼肉一样任人宰割,感谢佬友能把这种人揪出来避免更多人上当

GrayParis
GrayParis ↶ @neo
#42

直接封号这么狠 :rofl:

1个回复
neo
neo

他在没号顶+作假的情况下,还持续开车,这不封还会有更多佬友上当受骗。

↓ 跳到帖子
Sumimi
Sumimi 楼主 ↶ @osozos
#49

他用的是早期的方案,车主自建家宽VPS然后分发api,之前市场价差不多就是900块左右……这种掺水概率确实太高了

TOPIC OWNER
GrayParis
GrayParis
#51

骗骗站外不懂的就算了,站内的佬友还是糊弄不过去的

E0010
E0010
#53

虽然我不认可提问式验纯,但是掺水确实过了,还这么多人

user2902
#57

方木佬的team车真的是稳的一批,从来没封过,现在team涨价了,不知道他还做不做这个,他好像比较忙,team车都是闲的时候会开

1个回复
Forza_Milan
Forza_Milan

以前没封,最近的封了,看那个帖子

↓ 跳到帖子