INDEX
Explanations
end of sentence punctuation
New Auto-Interp
Negative Logits
असून
1.00
있으며
0.89
했고
0.83
했으며
0.78
karena
0.68
었고
0.68
がありますが
0.67
があり
0.66
していますが
0.66
いますが
0.65
POSITIVE LOGITS
۔
0.57
".
0.56
。
0.55
۔
0.53
።
0.52
>.
0.52
.。
0.50
.”
0.49
].
0.48
。
0.47
Activations Density 0.075%