INDEX
Negative Logits
-0.08
considerate
-0.08
raham
-0.07
fighter
-0.07
predefined
-0.07
-column
-0.07
epend
-0.07
respir
-0.07
Listen
-0.07
licking
-0.07
POSITIVE LOGITS
음악
0.09
sings
0.09
விள
0.08
сән
0.08
татар
0.08
desired
0.08
ஆன
0.08
карти
0.08
puisque
0.08
സംഗീത
0.08
Activations Density 0.001%