INDEX
Negative Logits
прой
-0.08
+E
-0.08
race
-0.07
prů
-0.07
intel
-0.07
_NUMBER
-0.07
WP
-0.06
všech
-0.06
render
-0.06
intestinal
-0.06
POSITIVE LOGITS
frankfurt
0.07
[_
0.07
clinics
0.07
ovatel
0.06
Yankees
0.06
централь
0.06
".↵
0.06
america
0.06
彩
0.06
everlasting
0.06
Activations Density 0.092%