INDEX
Negative Logits
Escape
-0.07
axial
-0.07
道路
-0.07
edges
-0.07
radial
-0.07
Criteria
-0.06
ahir
-0.06
analý
-0.06
vistas
-0.06
rape
-0.06
POSITIVE LOGITS
volunte
0.08
volunteer
0.08
FLAGS
0.07
rometer
0.07
vascular
0.07
neum
0.07
volunteered
0.07
volunteers
0.07
ycl
0.07
вол
0.07
Activations Density 0.005%