INDEX
Negative Logits
_inicio
-0.09
Nazis
-0.09
-provoking
-0.08
죽
-0.08
leys
-0.08
reas
-0.08
PROM
-0.08
아서
-0.08
गर्दा
-0.08
록
-0.08
POSITIVE LOGITS
imum
0.15
IMUM
0.15
imal
0.11
imized
0.10
allowable
0.09
distance
0.09
imize
0.09
_distance
0.09
事項
0.08
viable
0.08
Activations Density 0.024%