INDEX
Explanations
programming constructs `if`, `that`, `which`
New Auto-Interp
Negative Logits
你的
0.61
YOUR
0.59
Your
0.56
your
0.54
Votre
0.53
自己的
0.52
OUR
0.52
我的
0.52
our
0.51
ваша
0.50
POSITIVE LOGITS
we
0.74
you
0.68
einen
0.66
мы
0.66
আমরা
0.63
আপনাকে
0.63
você
0.62
используется
0.62
आपको
0.62
используются
0.61
Activations Density 0.323%