Richtig, denn da spielen auch noch andere Faktoren mit rein, wie z.B. das Gewicht, oder der Verbrauch.
Genauso haben PUs ein Layout und diese theoretischen Flops kommen nur raus, wenn die Software optimal auf das Layout ausgelegt ist und damit die PU zu 100% genutzt werden kann, was man aber prinzipbedingt nur hinkriegt, wenn man die (nutzlose) Software genau auf dieses Layout auslegt. Man will ja bei der FLOP-Ermittlung nichts sinnvolles berechnen, man will ja nur wissen was maximal ginge.
Spiele sind aber nicht darauf ausgelegt ein theoretisches Maximum aus einer PU rauszukitzeln, sondern die müssen eben das berechnen, was das Spiel wirklich braucht und wenn das eben nicht zum PU-Layout passt, dann kommt im Spiel auch nicht (annähernd) die theoretische Leistung an.
Stell dir vor, die NVidia-GPUs sind ein 1000 PS Dragster wie man sie eben kennt und AMD-GPUs sind ein Dragster mit 1500PS, aber halt mit Fahrradreifen. Welcher Dragster wird schneller sein?
Oder stell dir vor, 1000PS VS 1500PS. Aber die Strecke ist holprig. Dann kann da durchaus auch der mit "nur" 1000PS gewinnen, weil er z.B. das deutlich bessere Fahrwerk hat und deswegen mit der Buckelpiste deutlich besser klar kommt, während der mit 1500PS bei jedem Hubbel kurz abhebt und damit einen großen Anteil seiner eigentlich höheren Leistung im wahrsten Sinne des Wortes in die Luft bläst.