INDEX
Explanations
formatting or structural elements in text documents
list items or new paragraphs
New Auto-Interp
Negative Logits
geſch
-0.81
хьтан
-0.79
ſſung
-0.77
SharedDtor
-0.72
Хьажоргаш
-0.71
-0.71
Italijani
-0.71
Weiſe
-0.70
ſehr
-0.69
səhifə
-0.69
POSITIVE LOGITS
<<<<<<<<<<<<<<
0.43
inoltre
0.33
lisäksi
0.30
occasione
0.29
untung
0.28
Also
0.28
Therefore
0.28
I
0.28
Mask
0.27
Enlaces
0.27
Activations Density 0.049%