علي بابا الصينية تطرح نموذجا للذكاء الاصطناعي الاستدلالي ينافس النموذج زيرو وان

على عكس معظم نماذج الذكاء الاصطناعي، فإن QWQ32B Preview ونماذج الاستدلال الأخرى تتحقق من صحتها بشكل فعال. ويساعد هذا في تجنب بعض الأخطاء التي تواجهها النماذج عادةً. العيب هو أن إيجاد الحلول يستغرق وقتًا أطول.
Die auf Technologiethemen spezialisierte Website TechCrunch gab an, dass das neue Modell QWQ32B Preview, das vom Schwinn-Team von Alibaba entwickelt wurde, 32,5 Milliarden Variablen enthält und Anfragen mit bis zu 32.000 Wörtern pro Zeile verarbeiten kann. Einige Tests haben auch gezeigt, dass es besser abschneidet als die Modelle Zero One Preview und Zero One Mini, die beiden inferenziellen KI-Modelle, die Open AI bisher angeboten hat.
Laut den Tests von Alibaba übertraf der QWQ32B Preview die Zero One-Modelle in den AIME- und MITH-Tests. Der AIME-Test verwendet andere Modelle der künstlichen Intelligenz, um die Leistung eines Modells zu bewerten, und der MATH-Test besteht aus einer Reihe von Textaufgaben.
Das QWQ32B Preview-Modell kann dank seiner Argumentationsfähigkeiten logische Probleme lösen und schwierige mathematische Fragen logisch beantworten. Aber es ist nicht perfekt. Alibaba stellte in einem Online-Beitrag fest, dass das Modell möglicherweise unerwartet die Sprache wechselt, in Schleifen stecken bleibt oder bei Aufgaben, die „gutes Denken“ erfordern, schlecht abschneidet.
Im Gegensatz zu den meisten KI-Modellen validieren sich QWQ32B Preview und andere Inferenzmodelle aktiv. Dies hilft, einige der Fehler zu vermeiden, auf die Modelle normalerweise stoßen. Der Nachteil besteht darin, dass es länger dauert, bis Lösungen gefunden werden.