INDEX
Negative Logits
810
-0.06
700
-0.06
240
-0.06
νου
-0.06
Kath
-0.06
italic
-0.06
離
-0.06
330
-0.06
Emitter
-0.06
UCH
-0.06
POSITIVE LOGITS
TInt
0.06
betr
0.06
tuyển
0.06
cran
0.06
Apart
0.06
dění
0.06
munch
0.06
رقم
0.06
*A
0.06
essional
0.06
Activations Density 0.158%