INDEX
Negative Logits
Må
-0.08
ield
-0.08
dien
-0.08
vat
-0.07
oom
-0.07
morale
-0.07
ćen
-0.07
晚
-0.07
chlor
-0.07
vou
-0.07
POSITIVE LOGITS
إ
0.08
ذو
0.08
ثير
0.08
ذات
0.08
Eat
0.08
مصدر
0.08
پو
0.08
ذا
0.07
নিরাপ
0.07
مجرد
0.07
Activations Density 0.007%