继 #Grok-3 , #GPT-4.5 再次证实了模型规模的边际收益在剧烈递减。
我还没用过 #GPT-4.5,不过从宣传和目前的测评来看,和 #Grok-3非常像——超大规模的预训练(10x)、智力提升不明显、情商高。
两个模型的评分也非常接近:#Grok-3 1412 第一#GPT-4.5 1411 第二不过加入Style Control,差距就明显了:#GPT-4.5 1370 第一#GPT-4o 1341 第二#Grok-3 1334 第三但是最明显的差距还是价格吧。https://lmarena.ai/