INDEX
Negative Logits
Akt
-0.08
Beard
-0.07
tub
-0.07
(or
-0.07
உட
-0.07
Thür
-0.07
Paul
-0.07
🏻
-0.07
kr
-0.07
Ky
-0.06
POSITIVE LOGITS
�
0.09
laga
0.07
Sanford
0.07
נתי
0.07
remed
0.07
agradável
0.07
Sun
0.07
بندی
0.07
Sun
0.07
նկ
0.07
Activations Density 0.010%