INDEX
Negative Logits
ä¿
-0.16
isme
-0.15
èĢħ
-0.15
ä¼
-0.14
глÑıд
-0.14
ajo
-0.14
Tam
-0.14
iele
-0.14
(gl
-0.13
UNG
-0.13
POSITIVE LOGITS
targets
0.15
rov
0.15
roc
0.15
iya
0.14
iy
0.14
maiden
0.14
axy
0.13
iyah
0.13
vido
0.13
rou
0.13
Activations Density 0.014%