INDEX
Negative Logits
盛
-0.09
woo
-0.08
_static
-0.08
�
-0.07
囲
-0.07
-David
-0.07
mast
-0.07
rogue
-0.07
Xen
-0.07
hem
-0.07
POSITIVE LOGITS
掉
0.08
odings
0.08
всё
0.08
comprim
0.07
слова
0.07
మాట
0.07
म्म
0.07
始
0.07
quadratic
0.07
সব
0.07
Activations Density 0.005%