INDEX
Negative Logits
is
0.92
지
0.83
ek
0.83
ли
0.80
it
0.77
ல்
0.76
al
0.73
اب
0.70
us
0.69
的具体
0.69
POSITIVE LOGITS
sword
0.73
劍
0.72
Sword
0.70
ות
0.66
Sword
0.65
quente
0.64
ફેદ
0.63
あなたが
0.63
elenc
0.62
swords
0.59
Activations Density 0.003%
is
지
ek
ли
it
ல்
al
اب
us
的具体
sword
劍
Sword
ות
Sword
quente
ફેદ
あなたが
elenc
swords