INDEX
Negative Logits
(nb
-0.08
aaaaaaaa
-0.08
esas
-0.08
انجام
-0.07
aved
-0.07
Wanted
-0.07
anyag
-0.07
garner
-0.07
.extend
-0.07
.Se
-0.07
POSITIVE LOGITS
Friendship
0.08
盾
0.07
cyber
0.07
montr
0.07
Unterricht
0.07
μόνο
0.07
στον
0.07
Hopper
0.07
recht
0.07
fun
0.07
Activations Density 0.000%