INDEX
Negative Logits
adık
-0.07
.dataSource
-0.07
jac
-0.06
kaç
-0.06
Larson
-0.06
課
-0.06
ζ
-0.06
fleeing
-0.06
된다
-0.06
academic
-0.06
POSITIVE LOGITS
Prime
0.08
bakan
0.08
esome
0.07
ivered
0.07
eline
0.06
TG
0.06
!!!!!
0.06
.simple
0.06
.Standard
0.06
IL
0.06
Activations Density 0.007%