INDEX
    Explanations

    Spanish conjunctions "que" and "de"

    New Auto-Interp
    Negative Logits
     we
    0.50
     there
    0.47
    there
    0.40
     nhàng
    0.39
     these
    0.39
    jaar
    0.38
     dieser
    0.38
    these
    0.38
     certain
    0.38
     spezi
    0.38
    POSITIVE LOGITS
     أنها
    0.87
    ว่าเป็น
    0.83
     أنه
    0.67
    ว่า
    0.65
     ότι
    0.61
     انها
    0.58
     rằng
    0.57
     أنّ
    0.57
     że
    0.55
     mieć
    0.54
    Act Density 0.025%

    No Known Activations