Kizagan E4B Turkish (Agent) Türkçe Benchmark — 7.5B

Kizagan E4B Turkish (Agent) (7.5B) Türkçe benchmark — TurkishMMLU-Yüksel 47.4%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.

Kizagan E4B Turkish (Agent) — birinci-taraf ölçülen skorlar

Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.