【AI前沿】Anthropic用AI加速弱到强监督对齐研究,弱模型指导强模型训练