373eadc326b8a41d24866c12155e26d78b8ec831 - platform_external_llvm80

commit	373eadc326b8a41d24866c12155e26d78b8ec831	[log] [tgz]
author	Simon Pilgrim <llvm-dev@redking.me.uk>	Wed Dec 21 20:00:10 2016 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	Wed Dec 21 20:00:10 2016 +0000
tree	0b40cc4fd622c94d663243cdf2a6649a87acda5f
parent	6be18b904925ea62822b1558a6ecba369455c8c3 [diff]

[X86][SSE] Improve lowering of vXi64 multiplies 

As mentioned on PR30845, we were performing our vXi64 multiplication as:

AloBlo = pmuludq(a, b);
AloBhi = pmuludq(a, psrlqi(b, 32));
AhiBlo = pmuludq(psrlqi(a, 32), b);
return AloBlo + psllqi(AloBhi, 32)+ psllqi(AhiBlo, 32);

when we could avoid one of the upper shifts with:

AloBlo = pmuludq(a, b);
AloBhi = pmuludq(a, psrlqi(b, 32));
AhiBlo = pmuludq(psrlqi(a, 32), b);
return AloBlo + psllqi(AloBhi + AhiBlo, 32);

This matches the lowering on gcc/icc.

Differential Revision: https://reviews.llvm.org/D27756

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@290267 91177308-0d34-0410-b5e6-96231b3b80d8

9 files changed

tree: 0b40cc4fd622c94d663243cdf2a6649a87acda5f