INDEX
Negative Logits
циал
-0.08
kinderen
-0.08
nne
-0.08
Ün
-0.08
צו
-0.07
�
-0.07
Georgia
-0.07
/html
-0.07
்ச
-0.07
Nip
-0.07
POSITIVE LOGITS
and
0.11
alk
0.09
Talk
0.08
alad
0.08
Lim
0.08
оговор
0.08
atasi
0.08
еру
0.07
brid
0.07
орат
0.07
Activations Density 0.001%