INDEX
Negative Logits
valido
0.42
valid
0.42
ที่จะ
0.42
지도
0.39
acceptability
0.39
अपेक्षा
0.39
dovol
0.39
powod
0.39
sababu
0.39
designating
0.39
POSITIVE LOGITS
firsthand
0.57
Britain
0.54
fascinating
0.53
зион
0.52
الجديدة
0.49
quintessential
0.49
curated
0.49
المحلية
0.49
düny
0.47
прогре
0.47
Activations Density 0.160%