INDEX
Negative Logits
[
-0.07
aus
-0.07
plán
-0.07
kanı
-0.07
phải
-0.06
BEST
-0.06
este
-0.06
mat
-0.06
_first
-0.06
Angus
-0.06
POSITIVE LOGITS
свет
0.07
embodied
0.07
Oracle
0.06
acceler
0.06
оборуд
0.06
роз
0.06
eman
0.06
Emer
0.06
annihil
0.06
Phys
0.06
Activations Density 0.027%