INDEX
Negative Logits
ştır
-0.07
participate
-0.07
tools
-0.07
_None
-0.06
_pattern
-0.06
lay
-0.06
Simple
-0.06
/qt
-0.06
Ne
-0.06
overrun
-0.06
POSITIVE LOGITS
_dash
0.07
couleur
0.07
робота
0.07
sống
0.06
Ting
0.06
cons
0.06
احت
0.06
inicio
0.06
Boris
0.06
Recording
0.06
Activations Density 0.013%