INDEX
Negative Logits
ſelf
-0.73
nahilalakip
-0.71
ſelves
-0.71
CanadaChoose
-0.67
gameserver
-0.66
utafitiHapana
-0.65
Seeder
-0.65
queſta
-0.64
enderror
-0.63
ロウィン
-0.63
POSITIVE LOGITS
rather
0.65
effetto
0.56
voluntad
0.52
brazos
0.52
amistad
0.51
extracción
0.50
plutôt
0.49
effect
0.48
herida
0.47
teneur
0.47
Activations Density 0.646%