INDEX
Negative Logits
៉
-0.08
Ruth
-0.08
철
-0.08
Margin
-0.08
_fu
-0.07
安县
-0.07
�
-0.07
Trends
-0.07
Pf
-0.07
cuidad
-0.07
POSITIVE LOGITS
sequer
0.09
siquiera
0.09
ever
0.09
really
0.08
niti
0.08
ungeons
0.08
unethical
0.08
straks
0.08
قيام
0.08
whatsoever
0.08
Activations Density 0.017%