INDEX
Negative Logits
fet
-0.07
Walls
-0.07
Minist
-0.06
Race
-0.06
став
-0.06
Lew
-0.06
افی
-0.06
Gat
-0.06
أع
-0.06
Armen
-0.06
POSITIVE LOGITS
ffd
0.06
(workspace
0.06
0.06
kaynağı
0.06
haust
0.06
전국
0.06
ploy
0.06
betrayed
0.06
医疗
0.06
покуп
0.06
Activations Density 0.000%