INDEX
Negative Logits
Accred
-0.09
politely
-0.08
Comme
-0.08
ినా
-0.08
temporarily
-0.08
796
-0.07
राश
-0.07
résidence
-0.07
PTS
-0.07
Necess
-0.07
POSITIVE LOGITS
oak
0.08
eton
0.08
virker
0.08
eink
0.08
puol
0.08
glasses
0.08
wort
0.07
hemp
0.07
oak
0.07
rather
0.07
Activations Density 0.004%