INDEX
Negative Logits
}elseif
-0.16
oun
-0.15
adows
-0.15
зов
-0.14
572
-0.13
istrovstvÃŃ
-0.13
iu
-0.13
esses
-0.13
goodwill
-0.13
бо
-0.13
POSITIVE LOGITS
ãĥĥãĥĹ
0.15
zon
0.15
anye
0.15
õi
0.14
ös
0.14
tings
0.14
ænd
0.14
IMER
0.14
.bpm
0.13
andard
0.13
Activations Density 0.002%