INDEX
Negative Logits
verkehr
-0.08
fresh
-0.08
rins
-0.08
][:
-0.07
Alma
-0.07
evas
-0.07
burial
-0.07
Fresh
-0.07
scar
-0.07
అత
-0.07
POSITIVE LOGITS
ignez
0.09
מוד
0.08
skr
0.07
qh
0.07
गुण
0.07
logic
0.07
ongs
0.07
ิจ
0.07
insightful
0.07
Tout
0.07
Activations Density 0.011%