Specializing x86 range argument copying The ARM implementation of range argument copying was specialized in some cases. For all other architectures, it would fall back to generating memcpy. This patch updates the x86 implementation so it does not call memcpy and instead generates loads and stores, favoring movement of 128-bit chunks. Change-Id: Ic891e5609a4b0e81a47c29cc5a9b301bd10a1933 Signed-off-by: Razvan A Lupusoru <razvan.a.lupusoru@intel.com>

commit: 2c498d1f28e62e81fbdb477ff93ca7454e7493d7 [log] [tgz]
author: Razvan A Lupusoru <razvan.a.lupusoru@intel.com> Wed Jan 29 16:02:57 2014 -0800
committer: Ian Rogers <irogers@google.com> Wed Feb 05 22:42:21 2014 -0800
tree: 94654433a4dae83ab75d432304dcc0358aefeb1c
parent: 1dcff62155e8477eb114c8a86eb1beb0797ffc11 [diff] [blame]
diff --git a/compiler/dex/quick/x86/x86_lir.h b/compiler/dex/quick/x86/x86_lir.h
index 7f35d06..6962ff7 100644
--- a/compiler/dex/quick/x86/x86_lir.h
+++ b/compiler/dex/quick/x86/x86_lir.h

@@ -357,6 +357,14 @@
   kX86PsllqRI,                  // left shift of floating point registers
   kX86SqrtsdRR,                 // sqrt of floating point register
   kX86FstpdM,                   // Store and pop top x87 fp stack
+  Binary0fOpCode(kX86Movups),   // load unaligned packed single FP values from xmm2/m128 to xmm1
+  kX86MovupsMR, kX86MovupsAR,   // store unaligned packed single FP values from xmm1 to m128
+  Binary0fOpCode(kX86Movaps),   // load aligned packed single FP values from xmm2/m128 to xmm1
+  kX86MovapsMR, kX86MovapsAR,   // store aligned packed single FP values from xmm1 to m128
+  kX86MovlpsRM, kX86MovlpsRA,   // load packed single FP values from m64 to low quadword of xmm
+  kX86MovlpsMR, kX86MovlpsAR,   // store packed single FP values from low quadword of xmm to m64
+  kX86MovhpsRM, kX86MovhpsRA,   // load packed single FP values from m64 to high quadword of xmm
+  kX86MovhpsMR, kX86MovhpsAR,   // store packed single FP values from high quadword of xmm to m64
   Binary0fOpCode(kX86Movdxr),   // move into xmm from gpr
   kX86MovdrxRR, kX86MovdrxMR, kX86MovdrxAR,  // move into reg from xmm
   kX86Set8R, kX86Set8M, kX86Set8A,  // set byte depending on condition operand
commit	2c498d1f28e62e81fbdb477ff93ca7454e7493d7	[log] [tgz]
author	Razvan A Lupusoru <razvan.a.lupusoru@intel.com>	Wed Jan 29 16:02:57 2014 -0800
committer	Ian Rogers <irogers@google.com>	Wed Feb 05 22:42:21 2014 -0800
tree	94654433a4dae83ab75d432304dcc0358aefeb1c
parent	1dcff62155e8477eb114c8a86eb1beb0797ffc11 [diff] [blame]