INDEX
Negative Logits
beat
-0.09
apro
-0.08
çağ
-0.08
UMENT
-0.08
این
-0.08
ılır
-0.08
مف
-0.08
Alonso
-0.08
Apparently
-0.08
futur
-0.08
POSITIVE LOGITS
Layer
0.08
zin
0.08
薄
0.08
ительство
0.08
পাত
0.08
encé
0.07
ुद
0.07
Pall
0.07
অনুষ্ঠ
0.07
cay
0.07
Activations Density 0.004%