【预告】AI与月赛的顶级碰撞?

T2结果:ChatGPT0分且CE,DeepSeek100分,豆包80分

3 个赞

我没提交,他连结果都说不出来,一直在思考

但是 @2345安全卫士 都帮你试过了啊,
蛋小黄(蒟蒻)2345安全卫士C++大佬1 分钟

T2结果:ChatGPT0分且CE,DeepSeek100分,豆包80分

2 个赞

T3:DeepSeek20分TLE,其余0分WA

4 个赞

这是我的测试

1 个赞

所以deepseek和豆包差了10分?!

2 个赞

不是,T4deepseek30分豆包0

3 个赞

你这个不够靠谱,应该有多一些调试代码的机会的,我给了他们十轮。

(不过我这边 DS 跑了三轮 B 题怎么都是 0 分)

1 个赞

我的deepseek一轮大概5到10分钟,你等了多长时间?

1 个赞

10轮太多了吧

1 个赞

我告诉 DS 它可以选择跳过一道题来保证后面的题有充足的时间,但它似乎忽视了。

我的 DS 7 轮拿下 B 题 10 分也是比较强啊

1 个赞

差不多,小问题修正的话最快半分钟

1 个赞

逆天AI大战,AI的代码能力还需要提升啊

2 个赞

据说通义千问的代码模式非常nb

1 个赞

真的么,改天我试试

1 个赞

它可以用html5语言直接编一个火柴人跑酷

但是它的默认语言是html5,要注明是C++

1 个赞

这两个不是一个级别的吧

2 个赞