INDEX
Negative Logits
plane
-0.08
urel
-0.08
satisf
-0.08
Plane
-0.08
roads
-0.07
zni
-0.07
irty
-0.07
Plane
-0.07
.Resume
-0.07
STAMP
-0.07
POSITIVE LOGITS
ыҡ
0.08
Powers
0.08
proberen
0.08
حاول
0.08
الهند
0.08
prøve
0.08
probeer
0.08
ബി
0.08
编
0.08
cuba
0.07
Activations Density 0.000%