INDEX
Negative Logits
Dirty
-0.08
oriz
-0.08
cascade
-0.08
idzo
-0.08
dirty
-0.07
prohib
-0.07
Paging
-0.07
prohibited
-0.07
dirty
-0.07
paging
-0.07
POSITIVE LOGITS
Tunes
0.08
ترك
0.08
Potter
0.08
-trained
0.08
が
0.08
مرک
0.08
Bias
0.08
breakthrough
0.07
adlı
0.07
Fav
0.07
Activations Density 0.002%