INDEX
Negative Logits
Disconnect
-0.08
jemand
-0.07
ê
-0.06
842
-0.06
ppard
-0.06
欧美
-0.06
Cousins
-0.06
ое
-0.06
Với
-0.06
شت
-0.06
POSITIVE LOGITS
عفش
0.07
'er
0.06
REPL
0.06
gir
0.06
ekonom
0.06
ансов
0.06
ssa
0.06
alarak
0.06
]")
0.06
πρα
0.06
Activations Density 0.046%