INDEX
Negative Logits
op
-0.08
pros
-0.07
ın
-0.07
prevent
-0.07
opa
-0.07
irp
-0.07
hing
-0.07
(var
-0.07
oriental
-0.07
orn
-0.07
POSITIVE LOGITS
sicuramente
0.12
certainly
0.11
जरूर
0.10
kindlasti
0.10
뿐
0.10
lisäksi
0.10
ועוד
0.10
अलावा
0.10
뿐
0.10
וגם
0.09
Activations Density 0.072%