INDEX
Negative Logits
dwelling
-0.10
Dyn
-0.09
Dyn
-0.08
مكان
-0.08
Doors
-0.08
ன்றி
-0.08
honoring
-0.07
धो
-0.07
ऊन
-0.07
Canonical
-0.07
POSITIVE LOGITS
=~
0.09
defined
0.09
sen
0.08
Value
0.08
vs
0.08
val
0.08
vaut
0.08
equals
0.08
[::-
0.08
mey
0.07
Activations Density 0.019%