tr-Qwen2.5-0.5B-SFT v1 Türkçe Benchmark — 0.5B

tr-Qwen2.5-0.5B-SFT v1 (0.5B) Türkçe benchmark — TurkishMMLU-Yüksel 18.2%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.

tr-Qwen2.5-0.5B-SFT v1 — birinci-taraf ölçülen skorlar

ölçülmedi

Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.