INDEX
Negative Logits
CLUDING
0.64
yardımcı
0.62
జేపీ
0.59
약
0.59
ຈ
0.58
Hast
0.56
-]
0.56
dificuldades
0.55
ອາຫານ
0.55
Nachrichten
0.55
POSITIVE LOGITS
y
0.57
ला
0.54
time
0.45
gette
0.45
tat
0.45
spécifique
0.44
tikz
0.44
Union
0.44
م
0.44
вів
0.43
Activations Density 0.001%