INDEX
Explanations
affirmation and encouragement
New Auto-Interp
Negative Logits
unless
0.38
த்திற்காக
0.38
για
0.36
archiw
0.35
கடந்த
0.35
dla
0.35
для
0.35
RECOMM
0.35
यहीं
0.34
ത്തിനായി
0.34
POSITIVE LOGITS
initiative
0.73
timing
0.63
idea
0.59
iniciativa
0.59
attitude
0.55
choice
0.55
stuff
0.55
instincts
0.55
initiative
0.55
job
0.53
Activations Density 0.030%