Turkish-Gemma-9b-T1 Türkçe Benchmark — 9.2B
Turkish-Gemma-9b-T1 (9.2B) Türkçe benchmark — TurkishMMLU-Yüksel 55.7%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.
Turkish-Gemma-9b-T1 — birinci-taraf ölçülen skorlar
Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.