INDEX
Negative Logits
ules
-0.09
rhs
-0.08
rhs
-0.08
Evel
-0.08
Filipino
-0.08
HAVE
-0.08
ספר
-0.08
scala
-0.07
étr
-0.07
ंगल
-0.07
POSITIVE LOGITS
iaj
0.09
ìn
0.09
īn
0.09
ingu
0.08
ầm
0.08
ky
0.08
íz
0.08
ieri
0.08
ies
0.08
ially
0.08
Activations Density 0.002%