INDEX
Explanations
expressing gratitude or explaining
New Auto-Interp
Negative Logits
위
2.26
그리
2.23
워
2.15
자신
2.13
난
2.12
야
2.11
제대로
2.09
온
2.09
허
2.04
가
2.01
POSITIVE LOGITS
este
2.87
în
2.84
realizar
2.81
questo
2.77
magní
2.74
és
2.73
inox
2.72
esta
2.68
territorio
2.66
variante
2.65
Activations Density 1.492%