INDEX
Explanations
punctuation and conversational markers
New Auto-Interp
Negative Logits
tAux
0.37
เวณ
0.36
грева
0.36
Ꮏ
0.35
'**
0.35
牲
0.34
ので
0.34
囉
0.33
toLocale
0.32
市区
0.32
POSITIVE LOGITS
dont
0.41
dont
0.39
git
0.36
Sam
0.36
unmodified
0.36
nonstop
0.36
ns
0.35
耑
0.35
Italia
0.34
sec
0.33
Activations Density 0.048%