INDEX
Negative Logits
Biz
-0.07
,rp
-0.06
deline
-0.06
matriz
-0.06
tricks
-0.06
_hand
-0.06
weblog
-0.06
назва
-0.06
Boston
-0.06
Ask
-0.06
POSITIVE LOGITS
veel
0.07
ном
0.07
(:
0.07
_contents
0.06
rs
0.06
modifies
0.06
чно
0.06
تغییر
0.06
tek
0.06
аз
0.06
Activations Density 0.300%