INDEX
Negative Logits
itados
-0.08
.TEXT
-0.08
DAR
-0.08
gleich
-0.08
Know
-0.07
ischt
-0.07
dictated
-0.07
GAIN
-0.07
Ras
-0.07
Geburt
-0.07
POSITIVE LOGITS
emp
0.08
Ren
0.08
emp
0.08
Emp
0.08
secondary
0.08
0.07
617
0.07
cevap
0.07
ದಿ
0.07
Ν
0.07
Activations Density 0.005%