Kara-Kumru v1.0 2B Türkçe Benchmark — 2.4B
Kara-Kumru v1.0 2B (2.4B) Türkçe benchmark — TurkishMMLU-Yüksel 19.9%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.
Kara-Kumru v1.0 2B — birinci-taraf ölçülen skorlar
Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.