INDEX
Negative Logits
Hubert
-0.08
708
-0.07
)}
-0.07
Dl
-0.07
zapew
-0.07
Given
-0.07
Olaf
-0.07
hind
-0.07
upright
-0.07
ודות
-0.07
POSITIVE LOGITS
-ма
0.08
قامة
0.08
شارع
0.08
rook
0.08
價
0.08
استع
0.08
خواهد
0.08
nicht
0.08
Truck
0.08
financed
0.08
Activations Density 0.003%