INDEX
Explanations
foreign language greetings or phrases
New Auto-Interp
Negative Logits
گز
0.41
킬
0.39
지금
0.39
যন্ত্রণা
0.38
مطالعه
0.36
แก้
0.36
VES
0.36
वेर
0.35
Clarity
0.35
ماہ
0.35
POSITIVE LOGITS
αποτέ
0.44
hasilnya
0.41
Kamp
0.41
franche
0.37
sty
0.37
vred
0.37
poucos
0.36
também
0.36
พันธ์
0.35
viation
0.35
Activations Density 0.000%