INDEX
Negative Logits
iranje
0.59
atten
0.58
اختصاص
0.58
atien
0.58
intosh
0.57
沣
0.55
onneur
0.55
狛
0.55
incent
0.54
Cate
0.53
POSITIVE LOGITS
sav
0.57
unregulated
0.55
สอน
0.54
nevo
0.54
playas
0.52
бак
0.52
恸
0.52
unlucky
0.51
succeeded
0.50
ສົ
0.50
Activations Density 0.000%