INDEX
Explanations
possessives and contractions
New Auto-Interp
Negative Logits
Hound
1.65
dalam
1.49
dengan
1.48
looks
1.45
dari
1.44
Giving
1.42
terhadap
1.36
mingw
1.36
yti
1.36
Frame
1.35
POSITIVE LOGITS
reside
1.49
աջ
1.37
來的
1.34
നിന്നും
1.33
Sext
1.33
നിന്ന്
1.31
நுட்ப
1.30
heroism
1.28
igence
1.27
ến
1.26
Activations Density 0.194%