Mit einem auf den Benchmark angepassten KI-Modell konnte Meta Platz 2 bei LMArena erreichen. Ohne Cheats geht es abwärts.

    • smokeysnilas@feddit.org
      link
      fedilink
      Deutsch
      arrow-up
      2
      ·
      18 days ago

      Das impliziert, dass die Closed Source LLMs nicht genauso bei den Benchmarks betrügen. Ich würde eher schätzen die sind mindestens genauso schlimm und die OSS LLMs sind dann doch ganz nah am Stand der Technik.