matlab 空矩阵耗时,性能 – 更快的方式通过空矩阵乘法初始化数组? (Matlab)
這很奇怪,我看到f更快,而g比你看到的慢。但是他們對我來說都是一樣的。也許不同版本的MATLAB?
>> g = @() zeros(1000, 0) * zeros(0, 1000);
>> f = @() zeros(1000)
f =
@()zeros(1000)
>> timeit(f)
ans =
8.5019e-04
>> timeit(f)
ans =
8.4627e-04
>> timeit(g)
ans =
8.4627e-04
編輯可以添加1的f和g的結尾,并看看你得到什么時間。
編輯2013年1月6日7:42 EST
我正在使用一臺機器遠程,所以抱歉低質量的圖形(不得不生成他們盲目的)。
機器配置:
i7 920. 2.653 GHz。 Linux。 12 GB RAM。 8MB緩存。
它看起來甚至我可以訪問的機器顯示這種行為,除了在更大的尺寸(1979年和2073之間的某個地方)。沒有理由我現在可以想到的空矩陣乘法在更大的尺寸更快。
我會在回來之前多調查一下。
EDIT 2013年1月11日
在@ EitanT的帖子后,我想做一點點挖。我寫了一些C代碼,看看matlab可能如何創建一個零的矩陣。這里是我使用的c代碼。
int main(int argc, char **argv)
{
for (int i = 1975; i <= 2100; i+=25) {
timer::start();
double *foo = (double *)malloc(i * i * sizeof(double));
for (int k = 0; k < i * i; k++) foo[k] = 0;
double mftime = timer::stop();
free(foo);
timer::start();
double *bar = (double *)malloc(i * i * sizeof(double));
memset(bar, 0, i * i * sizeof(double));
double mmtime = timer::stop();
free(bar);
timer::start();
double *baz = (double *)calloc(i * i, sizeof(double));
double catime = timer::stop();
free(baz);
printf("%d, %lf, %lf, %lf\n", i, mftime, mmtime, catime);
}
}
這里是結果。
$ ./test
1975, 0.013812, 0.013578, 0.003321
2000, 0.014144, 0.013879, 0.003408
2025, 0.014396, 0.014219, 0.003490
2050, 0.014732, 0.013784, 0.000043
2075, 0.015022, 0.014122, 0.000045
2100, 0.014606, 0.014480, 0.000045
正如你可以看到calloc(第4列)似乎是最快的方法。它也在2025年和2050年之間顯著更快(我認為它將在2048左右?)。
現在我回到matlab檢查相同。這里是結果。
>> test
1975, 0.003296, 0.003297
2000, 0.003377, 0.003385
2025, 0.003465, 0.003464
2050, 0.015987, 0.000019
2075, 0.016373, 0.000019
2100, 0.016762, 0.000020
看起來f()和g()都使用較小大小的calloc(<2048?)。但是在更大的大小f()(zeros(m,n))開始使用malloc memset,而g()(zeros(m,0)* zeros(0,n) 因此,通過以下解釋分歧
> zeros(..)開始在較大的大小使用不同的(較慢?)方案。
> calloc也有些出乎意料地表現,導致性能的提高。
這是Linux上的行為。有人可以在不同的機器(也許不同的操作系統)上做同樣的實驗,看看實驗是否成立?
總結
以上是生活随笔為你收集整理的matlab 空矩阵耗时,性能 – 更快的方式通过空矩阵乘法初始化数组? (Matlab)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python课程设计矩阵对角线之和,为每
- 下一篇: java洗牌_java语言实现简单的洗牌