INDEX
Negative Logits
informant
-0.08
다
-0.08
ày
-0.07
obe
-0.07
Elem
-0.07
AO
-0.07
ayas
-0.07
Extended
-0.07
aciente
-0.07
ulta
-0.07
POSITIVE LOGITS
colum
0.06
sh
0.06
ぐ
0.06
Plum
0.06
Mushroom
0.06
Shrine
0.05
Michelle
0.05
pg
0.05
meet
0.05
dobr
0.05
Activations Density 0.000%