NumPy 基准测试#
使用 Airspeed Velocity 对 NumPy 进行基准测试.
用法#
Airspeed Velocity 会自行管理构建和 Python 虚拟环境,除非另有说明.要运行基准测试,您无需将 NumPy 的开发版本安装到当前的 Python 环境中.
在开始之前,请确保已安装 airspeed velocity.默认情况下, asv 附带对 anaconda 和 virtualenv 的支持:
pip install asv
pip install virtualenv
在贡献新的基准测试后,您应该在提交 pull request 之前在本地对其进行测试.
要运行所有基准测试,请在命令行中导航到 NumPy 根目录并执行:
spin bench
这将构建 NumPy 并运行在 benchmarks/ 中定义的所有可用基准测试.(注意:这可能需要一段时间.每个基准测试都会运行多次以测量执行时间的分布.)
对于在本地测试基准测试,最好在没有复制的情况下运行这些测试:
cd benchmarks/
export REGEXP="bench.*Ufunc"
asv run --dry-run --show-stderr --python=same --quick -b $REGEXP
其中用于匹配基准测试的正则表达式存储在 $REGEXP 中,并且使用 --quick 来避免重复.
要从特定的基准测试模块(例如 bench_core.py )运行基准测试,只需附加不带扩展名的文件名:
spin bench -t bench_core
要运行在类中定义的基准测试,例如来自 bench_creation.py 的 MeshGrid
spin bench -t bench_creation.MeshGrid
要比较基准测试结果与另一个版本/提交/分支的更改,请使用 --compare 选项(或等效的 -c ):
spin bench --compare v1.6.2 -t bench_core
spin bench --compare 20d03bcfd -t bench_core
spin bench -c main -t bench_core
上面的所有命令都在控制台中以纯文本显示结果,并且结果不会保存,以便与将来的提交进行比较.为了更好地控制,图形化视图以及保存结果以供将来比较,您可以运行 ASV 命令(记录结果并生成 HTML):
cd benchmarks
asv run -n -e --python=same
asv publish
asv preview
有关如何使用 asv 的更多信息,请参见 ASV documentation .可以通过 asv --help 和 asv run --help 像往常一样获得命令行帮助.
基准测试版本#
要在本地不同的机器上仅对发行版进行基准测试或可视化,可以在使用 asv 运行之前生成带有其提交的标签,即:
cd benchmarks
# Get commits for tags
# delete tag_commits.txt before re-runs
for gtag in $(git tag --list --sort taggerdate | grep "^v"); do
git log $gtag --oneline -n1 --decorate=no | awk '{print $1;}' >> tag_commits.txt
done
# Use the last 20
tail --lines=20 tag_commits.txt > 20_vers.txt
asv run HASHFILE:20_vers.txt
# Publish and view
asv publish
asv preview
有关贡献这些内容的详细信息,请参阅 benchmark results repository .
编写基准测试#
有关如何编写基准测试的基础知识,请参见 ASV documentation .
需要考虑的一些事项:
基准测试套件应该可以使用任何 NumPy 版本导入.
基准测试参数等不应取决于安装的 NumPy 版本.
尽量保持基准测试的运行时间合理.
对于基准测试时间,最好使用 ASV 的
time_方法,而不是通过time.clock拼凑时间测量,即使在编写基准测试时需要进行一些调整.准备数组等通常应放在
setup方法中,而不是time_方法中,以避免将准备时间与基准测试操作的时间一起计算.请注意,使用
np.empty或np.zeros创建的大型数组可能直到访问内存时才会在物理内存中分配.如果这是所需的行为,请确保在您的 setup 函数中进行注释.如果您正在对某个算法进行基准测试,那么用户不太可能在新创建的空/零数组上执行该算法.可以在创建数组后通过调用np.ones或arr.fill(value)来强制在 setup 阶段发生页面错误.