INDEX
Negative Logits
bilingual
-0.08
plaid
-0.07
Franken
-0.07
retention
-0.07
graffiti
-0.07
somit
-0.07
unterstützen
-0.07
Sext
-0.07
mehrere
-0.07
teal
-0.07
POSITIVE LOGITS
योग
0.09
Leia
0.09
غه
0.09
carn
0.09
katerih
0.09
pake
0.08
forb
0.08
आवश्यकता
0.08
जर
0.08
violate
0.08
Activations Density 0.022%