INDEX
Negative Logits
-être
-0.08
inture
-0.08
centimeter
-0.08
.presentation
-0.08
vanilla
-0.08
autocomplete
-0.07
bou
-0.07
-0.07
ktur
-0.07
esterol
-0.07
POSITIVE LOGITS
505
0.10
107
0.09
005
0.09
6
0.09
23
0.09
144
0.09
106
0.09
030
0.09
610
0.09
540
0.08
Activations Density 0.031%