7.6 Transformer的训练过程