INDEX
Negative Logits
rebel
-0.08
孟
-0.07
Touchable
-0.07
dividir
-0.07
แบ่ง
-0.07
方便
-0.07
diskr
-0.07
causal
-0.07
-0.07
违反
-0.07
POSITIVE LOGITS
erus
0.08
Preservation
0.08
nagpap
0.08
гэл
0.07
semper
0.07
gutters
0.07
guards
0.07
െങ്കിലും
0.07
luscious
0.07
caros
0.07
Activations Density 0.002%