INDEX
Negative Logits
ulot
-0.07
typen
-0.07
okom
-0.07
precated
-0.07
-sol
-0.07
ορ
-0.07
gradu
-0.07
',['../
-0.07
irres
-0.07
individuell
-0.07
POSITIVE LOGITS
banget
0.09
하게
0.09
boost
0.08
hace
0.08
obliga
0.08
적으로
0.08
чего
0.08
lace
0.08
کت
0.08
ли
0.08
Activations Density 0.002%