业务方向有点像贝壳的室内设计空间理解问项目,介绍的比较细八股PPO 和 GRPO 的区别ds zero 1 2 3做题计算X,Y的欧氏距离,用torch,需要注意 unsqeeze()扩展维度以便broadcast,以及dim=2 torch.sqrt(torch.sum((X.unsqeeze(1) - Y.unsqeeze(0))**2),dim=2) import torch X = torch.tensor([[1.0, 2.0], [3.0, 4.0]]) # 形状 [2, 2] Y = torch.tensor([[1.0, 1.0], [2.0, 2.0], [4.0, 4.0...