INDEX
Negative Logits
メール
0.68
அடுத்து
0.67
второй
0.61
utherland
0.60
бумаги
0.59
correo
0.59
𝗼
0.59
ColorEffects
0.58
stora
0.56
antoor
0.56
POSITIVE LOGITS
ל
0.65
ות
0.59
ح
0.58
conical
0.58
الم
0.55
ک
0.55
่วม
0.53
ان
0.52
SPI
0.50
ideology
0.50
Activations Density 0.001%