INDEX
Negative Logits
Pou
-0.08
Fails
-0.08
pretending
-0.08
Berk
-0.08
ホテル
-0.08
Pou
-0.07
ゲーム
-0.07
spending
-0.07
LTE
-0.07
Sent
-0.07
POSITIVE LOGITS
kọta
0.08
177
0.08
inverse
0.08
قائم
0.07
anch
0.07
-shop
0.07
ിക്കാൻ
0.07
mirada
0.07
纹
0.07
Greens
0.07
Activations Density 0.001%