INDEX
Negative Logits
itiro
-0.08
ンダ
-0.08
pristine
-0.07
כולם
-0.07
compelling
-0.07
შ
-0.07
ശക്ത
-0.07
ικής
-0.07
अश
-0.07
-ann
-0.07
POSITIVE LOGITS
saved
0.09
reached
0.09
cdr
0.09
aktar
0.08
exceeded
0.08
sav
0.08
Hurt
0.08
startup
0.08
alcanzar
0.08
dependant
0.08
Activations Density 0.020%