INDEX
Negative Logits
nearer
-0.08
ar
-0.07
seriousness
-0.07
terminology
-0.07
348
-0.07
occurrence
-0.07
434
-0.07
bö
-0.07
formas
-0.07
enumer
-0.07
POSITIVE LOGITS
Validate
0.08
मदद
0.08
validate
0.07
onz
0.07
ाँ
0.06
Val
0.06
uje
0.06
Patient
0.06
Vance
0.06
saldırı
0.06
Activations Density 0.010%