INDEX
Negative Logits
Fel
-0.07
dehy
-0.07
fish
-0.07
genel
-0.07
Blond
-0.07
okedex
-0.07
_df
-0.07
crest
-0.06
torch
-0.06
_assignment
-0.06
POSITIVE LOGITS
minimise
0.07
IE
0.06
dissent
0.06
Booking
0.06
bowling
0.05
輯
0.05
oine
0.05
rors
0.05
револю
0.05
Qing
0.05
Activations Density 0.006%