INDEX
Negative Logits
_AUTH
-0.08
dons
-0.08
_OS
-0.07
add
-0.07
olden
-0.07
"is
-0.07
(OS
-0.07
Act
-0.07
_oid
-0.07
_CONT
-0.07
POSITIVE LOGITS
Lieutenant
0.09
Luz
0.08
refrigerator
0.08
ريل
0.08
Santander
0.08
Hei
0.08
angano
0.08
Loja
0.07
陵
0.07
anten
0.07
Activations Density 0.014%