INDEX
Negative Logits
(res
-0.07
.parts
-0.07
.After
-0.06
улучш
-0.06
世紀
-0.06
occur
-0.06
Forms
-0.06
Honour
-0.06
marvelous
-0.06
.place
-0.06
POSITIVE LOGITS
Bat
0.09
BAT
0.08
bat
0.08
Bat
0.08
.bat
0.07
ासन
0.07
ait
0.07
Kat
0.07
273
0.07
Batman
0.07
Activations Density 0.003%