Qwen2.5-7B Turkish Culture Türkçe Benchmark — 7.6B
Qwen2.5-7B Turkish Culture (7.6B) Türkçe benchmark — TurkishMMLU-Yüksel 54.0%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.
Qwen2.5-7B Turkish Culture — birinci-taraf ölçülen skorlar
Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.