INDEX
Negative Logits
Density
-0.08
دا
-0.08
Clar
-0.07
Density
-0.07
pron
-0.07
Compliance
-0.07
Alberta
-0.07
ertia
-0.07
Zur
-0.07
sister
-0.07
POSITIVE LOGITS
/stretch
0.09
Duff
0.08
fences
0.08
ியல்
0.07
.scatter
0.07
dr
0.07
Kib
0.07
kand
0.07
фиг
0.07
Libre
0.07
Activations Density 0.001%