Trendyol-LLM 7B base v1.0 Türkçe Benchmark — 7.3B

Trendyol-LLM 7B base v1.0 (7.3B) Türkçe benchmark — TurkishMMLU-Yüksel 22.7%. Birinci elden ölçüm, donanım, hız ve yerel kurulum komutları.

Trendyol-LLM 7B base v1.0 — birinci-taraf ölçülen skorlar

ölçülmedi

Skorlar lm-evaluation-harness ile birinci-elden ölçüldü (5-shot, seed 42). Ölçülmeyen boyutlar "ölçülmedi" olarak işaretli; tahmin edilmez.