INDEX
Negative Logits
een
0.58
redan
0.56
wanneer
0.55
när
0.55
beim
0.52
kleinere
0.52
från
0.52
gebruikt
0.51
poids
0.50
alleged
0.49
POSITIVE LOGITS
和社会
0.61
和服务
0.50
노력
0.50
努力
0.49
आणि
0.45
행복
0.45
人々
0.45
जोशी
0.44
通知
0.44
FLICT
0.44
Activations Density 0.005%