INDEX
Negative Logits
.pt
-0.08
verb
-0.08
ads
-0.08
OA
-0.07
عاية
-0.07
CARE
-0.07
mata
-0.07
しました
-0.07
-expand
-0.07
dach
-0.07
POSITIVE LOGITS
身
0.08
Pink
0.07
ഇറ
0.07
convict
0.07
ezi
0.07
iere
0.07
Nick
0.07
Shakespeare
0.07
irritating
0.07
ليس
0.07
Activations Density 0.000%