INDEX
Negative Logits
Fame
-0.07
Tam
-0.07
Tam
-0.07
'ят
-0.07
ambah
-0.07
ahas
-0.07
Soy
-0.06
416
-0.06
Vid
-0.06
Manson
-0.06
POSITIVE LOGITS
que
0.12
qui
0.09
che
0.08
who
0.08
uke
0.07
ke
0.07
(q
0.07
(Q
0.07
Ц
0.07
κε
0.07
Activations Density 0.063%