INDEX
Negative Logits
annoying
-0.08
][]
-0.08
Ann
-0.08
劳动
-0.08
ิด
-0.07
justiça
-0.07
拿
-0.07
argentinos
-0.07
Mastercard
-0.07
vă
-0.07
POSITIVE LOGITS
_enc
0.08
הקד
0.08
هي
0.08
َيْ
0.07
0.07
fór
0.07
نظر
0.07
Kais
0.07
inkl
0.07
ók
0.07
Activations Density 0.003%