INDEX
Negative Logits
inde
-0.09
Jury
-0.08
_helpers
-0.07
เพลง
-0.07
cà
-0.07
Northeast
-0.07
agonia
-0.07
Raff
-0.07
लक्ष
-0.07
প্রদ
-0.07
POSITIVE LOGITS
-called
0.13
far
0.10
far
0.08
Far
0.08
biste
0.08
ਕਿ
0.08
써
0.07
rot
0.07
کہ
0.07
allow
0.07
Activations Density 0.082%