INDEX
Negative Logits
Zm
-0.08
SX
-0.07
அள
-0.07
cology
-0.07
biology
-0.07
dont
-0.07
Thor
-0.07
RP
-0.07
soap
-0.06
Robin
-0.06
POSITIVE LOGITS
terraces
0.09
grupper
0.08
strap
0.08
groepen
0.08
Strap
0.08
tonen
0.07
groupes
0.07
мат
0.07
vorstellen
0.07
группы
0.07
Activations Density 0.220%