GPT-2 Text Generation

Temperature: Controls randomness. Low (0.1-0.3) = focused/repetitive. High (1.0-2.0) = creative/chaotic.

Top-k: Only consider the top-k most likely tokens. Lower = more focused. 0 = no limit.

Top-p (nucleus sampling): Only consider tokens whose cumulative probability exceeds p. Lower = more focused.

Repetition Penalty: Penalizes tokens that already appeared. >1.0 reduces repetition.

Try these experiments: