INDEX
Negative Logits
Libert
-0.08
Asking
-0.08
tile
-0.07
Augustus
-0.07
079
-0.07
的钱
-0.07
_apps
-0.07
ร้อง
-0.07
बज
-0.07
bur
-0.07
POSITIVE LOGITS
elettron
0.08
pand
0.08
_delete
0.08
auten
0.08
ipherals
0.08
anus
0.07
яр
0.07
underv
0.07
crit
0.07
tay
0.07
Activations Density 0.002%