INDEX
Negative Logits
isposable
-0.07
nis
-0.06
\system
-0.06
inan
-0.06
_DLL
-0.06
roup
-0.06
.ov
-0.06
figures
-0.06
agle
-0.06
abra
-0.06
POSITIVE LOGITS
another
0.09
what
0.07
Zac
0.07
aken
0.07
something
0.07
acent
0.07
Beng
0.07
811
0.06
Bast
0.06
attest
0.06
Activations Density 0.038%