INDEX
Negative Logits
prot
-0.08
Helf
-0.08
erro
-0.08
Plants
-0.08
Fu
-0.08
済
-0.07
renowned
-0.07
Stam
-0.07
feat
-0.07
LOL
-0.07
POSITIVE LOGITS
女人
0.08
وا
0.07
நீ
0.07
cad
0.07
ಅವ
0.07
�
0.07
แบบ
0.07
长期
0.07
Catal
0.07
િયાદ
0.07
Activations Density 0.001%