#o1 不显示思考过程的设置是正确的,现在的LLMs即使能弄出数学题的正确答案,过程也一塌糊涂,显示出来只能暴露他的愚蠢。
#Gemini 1.5 Pro 002确实比其他的Gemini都慢得多,但不总会给出最好的输出。大概类似 #o1 ,用了更多算力来推理,结果是倾向于较短的输出。
我发现我根本没有需要动用 #o1 的问题。
#o1 和 #Gemini Thinking答案一样的话,我基本就不再怀疑了。
#o3-mini很强大,但是并不可靠。同一个问题,时而非常聪明,时而非常智障。 #o1 和 #R1 就比较稳定。