INDEX
Explanations
the Japanese particle "と" indicating connections or relationships
New Auto-Interp
Negative Logits
思います
-0.63
事です
-0.63
WriteBarrier
-0.59
気がします
-0.56
思った
-0.54
ことはありません
-0.50
のかもしれません
-0.49
ことです
-0.48
くれない
-0.48
angela
-0.48
POSITIVE LOGITS
と
2.71
と
1.75
りと
1.47
와
1.46
과
1.43
とお
1.39
ーと
1.34
いと
1.27
とも
1.21
との
1.16
Activations Density 0.028%