INDEX
Negative Logits
_CE
-0.08
масс
-0.08
חב
-0.07
cerc
-0.07
Theodore
-0.07
_LOC
-0.07
sách
-0.07
lign
-0.07
diseñador
-0.07
marché
-0.07
POSITIVE LOGITS
ambah
0.07
回国
0.07
:A
0.07
所以
0.06
');</
0.06
иметь
0.06
_counter
0.06
)y
0.06
したい
0.06
Labels
0.06
Activations Density 0.001%