INDEX
Negative Logits
WikiLeaks
-0.08
dire
-0.07
廷
-0.07
-F
-0.06
cryptocurrency
-0.06
Walk
-0.06
string
-0.06
Parking
-0.06
gas
-0.06
елем
-0.06
POSITIVE LOGITS
-notch
0.07
ıs
0.06
ayud
0.06
controlled
0.06
Undo
0.06
POT
0.06
відповідаль
0.06
із
0.06
назад
0.06
승
0.05
Activations Density 0.026%