INDEX
Negative Logits
பெரும்பாலும்
0.54
могли
0.53
கதாபாத்திர
0.52
दोघा
0.50
誤
0.50
nashvillehousing
0.48
பெரும்பாலான
0.48
𐰇
0.47
्ता
0.47
взаимодей
0.46
POSITIVE LOGITS
first
0.51
who
0.47
Super
0.46
whose
0.46
the
0.45
one
0.44
steel
0.44
Steel
0.44
Switch
0.44
well
0.43
Activations Density 0.003%