INDEX
Explanations
phrases that express similarity or comparison
New Auto-Interp
Negative Logits
Efq
-0.87
ſever
-0.84
Majefty
-0.83
fevere
-0.80
bewerken
-0.80
Rukh
-0.78
StatelessWidget
-0.77
ſeveral
-0.77
حياته
-0.77
purpoſe
-0.75
POSITIVE LOGITS
como
1.66
comme
1.66
như
1.35
як
1.29
Como
1.27
jako
1.26
как
1.25
como
1.24
kaip
1.21
wie
1.20
Activations Density 0.186%