Turkish-Gemma-4b-T1-Scout Türkçe Benchmark — 4.3B

Turkish-Gemma-4b-T1-Scout (4.3B) Türkçe benchmark — TurkishMMLU-Yüksel 44.8%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.

Turkish-Gemma-4b-T1-Scout — birinci-taraf ölçülen skorlar

ölçülmedi

Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.