INDEX
Negative Logits
réussir
0.59
在
0.59
ujących
0.59
و
0.57
,
0.57
م
0.56
のは
0.56
ریان
0.55
К
0.55
oría
0.54
POSITIVE LOGITS
頭
0.58
T
0.55
ar
0.55
unele
0.55
tio
0.54
tio
0.54
ilha
0.54
B
0.53
tte
0.53
kant
0.53
Activations Density 0.004%
réussir
在
ujących
و
,
م
のは
ریان
К
oría
頭
T
ar
unele
tio
tio
ilha
B
tte
kant