INDEX
Negative Logits
atol
-0.09
regime
-0.07
ignored
-0.07
rs
-0.07
Notation
-0.07
enjoyed
-0.07
са
-0.07
stirred
-0.07
questionable
-0.07
sau
-0.07
POSITIVE LOGITS
仪
0.08
komplett
0.08
చూప
0.07
芝
0.07
警方
0.07
lungen
0.07
อย่าง
0.07
witness
0.07
الشمس
0.07
타
0.07
Activations Density 0.036%