INDEX
Negative Logits
intact
-0.10
emblem
-0.08
institutional
-0.07
illusion
-0.07
hallmark
-0.07
مز
-0.07
अख
-0.07
ഞ
-0.07
competit
-0.07
violent
-0.07
POSITIVE LOGITS
adlı
0.08
Valley
0.08
.sqrt
0.08
Nombre
0.07
岁
0.07
Ibrahim
0.07
人成
0.07
caliber
0.07
ដែល
0.07
Shelter
0.07
Activations Density 0.039%