分享一个大模型在polymarket上的预测数据

人工智能
查看原帖
40 楼层
39 回复
31 用户
Shikha Tallone qi_xing_jk nako
Tallone
Tallone
#5

好又咋样?好给你sonnet-4.6旗舰模型蹬嘛 :joy:

Hixz12
Hixz12
#8

不同情况下 或许有不同表现
一切按实际体验为准。
其次是有时候经常一个弄不出来 另一个配合着就没问题了。不是只能用一个的。 :smiling_face_with_tear:

Apollo0317
Apollo0317
#13

这个”最好”如何定义?最后如何核实哪家公司确实最好?

cloudwide
cloudwide
#15

你要不读读这个评判标准呢:thinking:
这三月不是还没过完吗,怎么就比arena要更权威了

PaimonForever
PaimonForever
#19

要是GPT 5.4 网页版能给xhigh一半的juice就好了,但凡他不思考我都觉得有点弱智。 :sob:

coding1
#25

哥们,起码要看编程的benchmark吧,你整这个何意味

waile
waile
#29

贴吧遇到引战拉踩的举报无效,我试试L站有没有效果 :melting_face:

Qiner
Qiner
#32

:bili_040: 楼主我挺你,只要挺 Opus 的我都支持。我们弱小无助的 Opus 真爱粉总是被 GPT 粉丝打压,是时候站起来了!

不是,为毛这帖也有多个举报啊

2个回复
SKDG042
SKDG042 ↶ @Qiner
#35

涉嫌攻击和带节奏吧, 去掉标题的 吹gpt5.4的可以醒醒了 应该也没啥事

hhhchq
hhhchq ↶ @Qiner
#40

哎呦这sam怎么这么坏 :bili_040:

↓ 跳到帖子
SKDG042
SKDG042
#33

进来三天就学会引战带节奏可还行

想说claude比gpt强就说
试图攻击佬友带节奏还是抬走吧

SKDG042
SKDG042 ↶ @Qiner
#35

涉嫌攻击和带节奏吧, 去掉标题的 吹gpt5.4的可以醒醒了 应该也没啥事

xiniah
xiniah
#39

一进来就带引战和节奏吗,这边可不是和其他国内网站一样随便引战的 :laughing:
新号被举报有被封号的风险哦