INDEX
Negative Logits
wani
-0.08
Wes
-0.07
Raim
-0.07
oun
-0.07
wiet
-0.07
burdens
-0.07
discour
-0.07
विर
-0.07
.tc
-0.07
STRICT
-0.07
POSITIVE LOGITS
dogs
0.09
Ships
0.08
कि
0.08
Dok
0.08
Dogs
0.08
ko
0.08
данный
0.08
gemeinsam
0.08
An
0.07
gemeins
0.07
Activations Density 0.010%