INDEX
Negative Logits
Gara
-0.08
escorted
-0.08
angel
-0.08
criado
-0.08
vamp
-0.07
erving
-0.07
ritten
-0.07
巡视
-0.07
ANGED
-0.07
адар
-0.07
POSITIVE LOGITS
હીં
0.08
obscure
0.08
ność
0.08
عوبة
0.08
تاب
0.08
cuesta
0.08
غات
0.08
кти
0.08
skyld
0.08
idikan
0.08
Activations Density 0.003%