INDEX
Negative Logits
lounge
-0.09
Lounge
-0.08
Trans
-0.08
Naval
-0.07
stool
-0.07
либ
-0.07
Louis
-0.07
Lebanon
-0.07
Lawrence
-0.07
-0.07
POSITIVE LOGITS
्थ
0.08
fili
0.08
zudem
0.08
flick
0.08
feature
0.08
Wy
0.08
winger
0.07
gane
0.07
치
0.07
fing
0.07
Activations Density 0.312%