INDEX
Negative Logits
పె
0.39
ვნ
0.39
Metallic
0.39
கலோரிகள்
0.38
遉
0.38
beryllium
0.38
甲
0.37
मार
0.36
Correlation
0.36
কির
0.36
POSITIVE LOGITS
university
0.48
pard
0.45
forgiveness
0.45
militaire
0.42
student
0.42
amnesty
0.42
的学生
0.41
赦
0.41
renegoti
0.40
universitet
0.40
Activations Density 0.017%