INDEX
Explanations
purpose or explanation context
New Auto-Interp
Negative Logits
สำหรับ
0.43
सांस्कृतिक
0.36
عنوان
0.36
från
0.35
ആരോഗ്യ
0.35
我对
0.34
Schriftsteller
0.34
ünstler
0.34
स्कूली
0.33
konuda
0.33
POSITIVE LOGITS
כדי
0.48
使其
0.45
afin
0.42
เพื่อให้
0.42
allowing
0.41
adds
0.41
ensuring
0.40
giving
0.40
Чтобы
0.40
ώστε
0.40
Activations Density 0.312%