INDEX
Negative Logits
jó
-0.07
004
-0.06
Nad
-0.06
參
-0.06
medi
-0.06
۱۵
-0.06
-Semit
-0.06
ład
-0.06
орм
-0.06
mpl
-0.05
POSITIVE LOGITS
enumerate
0.07
describing
0.07
argue
0.07
nejsou
0.07
warehouse
0.07
_periods
0.07
russ
0.06
Pending
0.06
artificial
0.06
rhetoric
0.06
Activations Density 0.126%