INDEX
Explanations
punctuation marks, especially sentence-ending characters
New Auto-Interp
Negative Logits
andag
-0.65
ᴇ
-0.63
fag
-0.62
städ
-0.61
Rptr
-0.60
Argus
-0.59
leſs
-0.58
VEGET
-0.58
Ï
-0.57
vs
-0.57
POSITIVE LOGITS
。
2.23
।
1.62
)。
1.60
%。
1.40
)。
1.40
。
1.38
”。
1.30
۔
1.23
.。
1.16
ہیں۔
1.14
Activations Density 0.041%