INDEX
Negative Logits
ар
0.59
Ти
0.49
↵↵↵↵↵↵↵↵↵↵↵↵↵
0.48
↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵
0.48
0.47
पीडी
0.47
↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵
0.47
↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵
0.47
↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵↵
0.46
マル
0.46
POSITIVE LOGITS
recob
0.47
cloths
0.41
construct
0.40
weh
0.38
枱
0.38
$
0.38
مفه
0.38
кере
0.38
一共
0.38
ระหว่าง
0.38
Activations Density 0.012%