INDEX
Negative Logits
Yr
-0.08
mynd
-0.08
infile
-0.08
nghe
-0.08
cules
-0.08
ink
-0.08
cél
-0.07
nasium
-0.07
/cu
-0.07
आवाज
-0.07
POSITIVE LOGITS
newbie
0.08
禁
0.08
ఇంద
0.07
newbies
0.07
bestehen
0.07
అనంత
0.07
(Simple
0.07
uppen
0.07
beginners
0.07
-root
0.07
Activations Density 0.011%