INDEX
Negative Logits
Ö
-0.10
Numerical
-0.09
ø
-0.08
Î
-0.08
Nets
-0.08
�
-0.08
slots
-0.08
supplements
-0.08
Kolleg
-0.08
hara
-0.07
POSITIVE LOGITS
ார்
0.08
tyranny
0.08
Voor
0.08
عودة
0.08
ert
0.08
0.07
Statement
0.07
safe
0.07
Statements
0.07
ข้อความ
0.07
Activations Density 0.032%