INDEX
Negative Logits
Cont
-0.08
só
-0.07
.choice
-0.07
илки
-0.07
.tr
-0.07
CONT
-0.07
pogod
-0.07
,只
-0.07
histogram
-0.07
flakes
-0.07
POSITIVE LOGITS
Bast
0.09
abraz
0.08
Vý
0.08
μέ
0.08
Alessandro
0.07
abbrevi
0.07
Strait
0.07
iteli
0.07
Abe
0.07
-uit
0.07
Activations Density 0.001%