INDEX
Negative Logits
freaking
-0.08
WTF
-0.08
tramo
-0.07
Kry
-0.07
brand
-0.07
tribe
-0.07
steken
-0.07
tratar
-0.07
manchen
-0.07
brands
-0.07
POSITIVE LOGITS
babagan
0.09
للغاية
0.08
,例如
0.08
respecto
0.08
akin
0.08
,并
0.07
,比如
0.07
જેથી
0.07
Value
0.07
ennent
0.07
Activations Density 0.022%