【快乐开源】Paddle Tensor 规范化二期 API 支持 0-size Tensor No.13-17：paddle.mean、paddle.sum、paddle.prod、paddle.var、paddle.std #71504

cangtianhuang · 2025-03-08T11:53:34Z

PR Category

Operator Mechanism

PR Types

Bug fixes

Description

【快乐开源】Paddle Tensor 规范化二期 #69908

该 PR 主要修改了 paddle.mean 、paddle.sum 、paddle.prod 、paddle.var 、paddle.std 等 reduce 方法的相关代码与内核，使其支持处理 0-size Tensor 。C++ 侧修改了多个前向 kernel，但未修改反向 kernel ；Python 侧在 var 方法处做了一个巧妙的小修改。

期望的值：("mean", float("nan")), ("prod", 1), ("std", float("nan")), ("sum", 0), ("var", float("nan")),

具体修改如下：

1. `paddle.mean`

修改了 phi 库的 C++ 前向 kernel，包括 cpu、kps、onednn、xpu 等多设备。为了增强算子 kernel 的复用，修改集中在了底层的 MeanRawKernel 处。

在paddle\phi\kernels\cpu\reduce_mean_kernel.cc 、paddle\phi\kernels\kps\reduce_kernel.cu 、paddle\phi\kernels\onednn\reduce_mean_kernel.cc 、paddle\phi\kernels\xpu\reduce_mean_kernel.cc 中，增加了对 0-size Tensor 的处理逻辑。由于输出形状已经由 SumRawInferMeta 正确推断并保存在 DenseTensor* out 中，因此无需增加额外推断逻辑，直接调用 FullKernel，填充 NaN 值并返回。

此外，onednn 的 FullKernel （位于 paddle\phi\kernels\onednn\full_kernel.cc）原先不支持 phi::dtype::bfloat16 类型，为其增添了注册类型。

2. `paddle.sum`

同 paddle.mean 修改思路一致，修改了 phi 库的 C++ 前向 kernel，修改集中在 SumRawKernel 处。

在 paddle\phi\kernels\cpu\reduce_sum_kernel.cc 、paddle\phi\kernels\kps\reduce_kernel.cu 、paddle\phi\kernels\onednn\reduce_sum_kernel.cc 、paddle\phi\kernels\xpu\reduce_sum_kernel.cc 中，增加了对 0-size Tensor 的处理逻辑，直接调用 FullKernel，填充 0 值并返回。

在 #70379 中为 SumRawKernel 添加了较多的 0-size Tensor 推断逻辑，我认为这是不必要的并删去了冗余部分。

3. `paddle.prod`

同 paddle.mean 修改思路一致，修改了 phi 库的 C++ 前向 kernel，修改集中在 ProdKernel 处。

在 paddle\phi\kernels\cpu\prod_kernel.cc 、paddle\phi\kernels\kps\reduce_kernel.cu 、paddle\phi\kernels\xpu\prod_kernel.cc 中（onednn 中没有 ProdKernel ），增加了对 0-size Tensor 的处理逻辑，直接调用 FullKernel，填充 1 值并返回。

4. `paddle.var`

在 C++ 侧， paddle.var 不存在单独的多设备算子，而是由 VarianceKernel 执行并调用 Mean 、Subtract 、Multiply 、 MeanKernel 执行。因此直接在 paddle\phi\kernels\reduce_variance_kernel.cc 处增加了对 0-size Tensor 的处理逻辑，调用 FullKernel 填充 NaN 值并返回。

在 Python 侧，在 python\paddle\tensor\stat.py 中为了确保动静图一致，且保持性能不下降，对无偏时 n > one_const 处做了一个巧妙的修改，使得当 n<=1 时 n 值不变（ unbiased = True 时，n=1 无法无偏，n=0 则 out/0 得到期望的 NaN 值； unbiased = False 时，n=0 out/0 也得到期望的 NaN 值），确保形状与数值永远满足期望。

5. `paddle.std`

在 Python 侧，paddle.std 调用 paddle.var 并开方，对于 0-size Tensor NaN 开方后仍旧为 NaN ，因此代码不变。

经测试， paddle.mean 、paddle.sum 、paddle.prod 、paddle.var 、paddle.std 通过了 “0-size tensorAPI 支持 0-size Tensor No.13-17” 的测试。且在 [], [0,], [0, 3], [2, 0, 4] 等多个 0-size Tensor 形状中表现与预期一致。

单测：

自己编写的测试：

into support-0-size

paddle-bot · 2025-03-08T11:53:40Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

into support-0-size

cangtianhuang · 2025-03-09T10:47:57Z

python侧的修改降低了api性能……

cangtianhuang and others added 11 commits March 7, 2025 16:55

Support 0-size tensor in paddle.mean and paddle.sum.

87ff224

Merge branch 'PaddlePaddle:develop' into support-0-size

ed31aa2

Support 0-size tensor of paddle.mean/sum/prod/var

9e4b4db

Support 0-size tensor of paddle.mean/sum/prod/var

21a0172

Merge branch 'support-0-size' of https://github.com/cangtianhuang/Paddle

4adbf4a

into support-0-size

Merge branch 'PaddlePaddle:develop' into support-0-size

b0509d4

Merge branch 'support-0-size' of https://github.com/cangtianhuang/Paddle

2870d38

into support-0-size

Merge branch 'support-0-size' of https://github.com/cangtianhuang/Paddle

3116085

into support-0-size

support 0-size tensor of paddle.var/std in python side

d38ad62

Modify the special verdict.

f625bc9

Merge branch 'PaddlePaddle:develop' into support-0-size

1fbed18

paddle-bot bot added the contributor External developers label Mar 8, 2025

cangtianhuang added 2 commits March 8, 2025 22:11

Modify static graph mode flow in paddle.var.

12cae3c

Merge branch 'support-0-size' of https://github.com/cangtianhuang/Paddle

56e0962

into support-0-size

Merge branch 'PaddlePaddle:develop' into support-0-size

cd3b793

cangtianhuang closed this Mar 9, 2025

Modify the python code by using an extremely clever approach.

6d13705

cangtianhuang reopened this Mar 9, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【快乐开源】Paddle Tensor 规范化二期 API 支持 0-size Tensor No.13-17：paddle.mean、paddle.sum、paddle.prod、paddle.var、paddle.std #71504

【快乐开源】Paddle Tensor 规范化二期 API 支持 0-size Tensor No.13-17：paddle.mean、paddle.sum、paddle.prod、paddle.var、paddle.std #71504

cangtianhuang commented Mar 8, 2025 •

edited

Loading

paddle-bot bot commented Mar 8, 2025

cangtianhuang commented Mar 9, 2025

【快乐开源】Paddle Tensor 规范化二期 API 支持 0-size Tensor No.13-17：paddle.mean、paddle.sum、paddle.prod、paddle.var、paddle.std #71504

Are you sure you want to change the base?

【快乐开源】Paddle Tensor 规范化二期 API 支持 0-size Tensor No.13-17：paddle.mean、paddle.sum、paddle.prod、paddle.var、paddle.std #71504

Conversation

cangtianhuang commented Mar 8, 2025 • edited Loading

PR Category

PR Types

Description

1. paddle.mean

2. paddle.sum

3. paddle.prod

4. paddle.var

5. paddle.std

paddle-bot bot commented Mar 8, 2025

cangtianhuang commented Mar 9, 2025

cangtianhuang commented Mar 8, 2025 •

edited

Loading

1. `paddle.mean`

2. `paddle.sum`

3. `paddle.prod`

4. `paddle.var`

5. `paddle.std`