INDEX
Negative Logits
ೕ
-0.09
نع
-0.08
Christ
-0.08
വര്
-0.08
πί
-0.08
mast
-0.08
oref
-0.07
koek
-0.07
delays
-0.07
pleinement
-0.07
POSITIVE LOGITS
sexuality
0.08
Independ
0.08
Airbnb
0.08
Granite
0.08
generates
0.08
Consumer
0.08
Außen
0.08
zde
0.07
947
0.07
rys
0.07
Activations Density 0.005%