INDEX
Explanations
describing with relative qualifiers
New Auto-Interp
Negative Logits
например
0.89
基本的に
0.88
一些
0.85
মূলত
0.83
例如
0.82
例えば
0.82
尽可能
0.82
quaisquer
0.82
例如
0.82
یعنی
0.81
POSITIVE LOGITS
unscathed
0.99
unexplored
0.93
unremarkable
0.90
straightforward
0.87
unnoticed
0.87
untouched
0.84
innocuous
0.84
anonymous
0.84
unassuming
0.83
tame
0.82
Activations Density 0.145%