INDEX
Negative Logits
waypoint
-0.08
Geo
-0.08
onda
-0.08
ಿಕ್ಕ
-0.08
фильм
-0.08
audience
-0.07
ె
-0.07
figuring
-0.07
�
-0.07
節
-0.07
POSITIVE LOGITS
plu
0.09
Els
0.08
العربية
0.08
.pl
0.08
força
0.08
Husk
0.08
HI
0.08
ție
0.08
impair
0.08
கூட
0.08
Activations Density 0.004%