INDEX
Negative Logits
disclaim
-0.09
Leiden
-0.08
curled
-0.08
humano
-0.07
DI
-0.07
人在
-0.07
irons
-0.07
-F
-0.07
في
-0.07
alemán
-0.07
POSITIVE LOGITS
contamination
0.08
symptomatic
0.08
청
0.08
alamat
0.07
distro
0.07
packing
0.07
pik
0.07
beurt
0.07
Ihren
0.07
moisture
0.07
Activations Density 0.038%