INDEX
Negative Logits
imum
-0.07
eyewitness
-0.07
Viewer
-0.07
ikker
-0.07
ץ
-0.07
cooperation
-0.07
Unidad
-0.07
sto
-0.07
ान
-0.07
Shel
-0.07
POSITIVE LOGITS
Kills
0.09
inis
0.08
recommended
0.08
demor
0.08
ported
0.08
prescribing
0.08
argu
0.08
geprü
0.08
coding
0.08
leggings
0.08
Activations Density 0.001%